Nuo nulio iki AI vaizdo analizatoriaus per 5 minutes: vadovas pradedančiajam

Ar norite sužinoti, kaip sukurti AI vaizdo analizatorių? Tada perskaitykite šį straipsnį iki galo! Parodysiu, kaip iš tikrųjų paprastai sukurti AI analizatoriaus įrankius, todėl beveik nereikia turėti jokių išankstinių žinių. Nuvessiu jus žingsnis po žingsnio, o mes naudosime Project IDX ir Gemini API. Tai reiškia, kad jums nereikia nieko nustatyti; viskas, ką darysime, yra debesyje. Jei esate pasiruošę, pradėkime!

Apsilankykite mano „YouTube“ kanale

Turinys

Darbo su projektu IDX pradžia

Pirmasis žingsnis yra gana paprastas. Turime atidaryti svetainę idx.google.com. Jei dar neužsiregistravote, pirmiausia turite užsiregistruoti, o tada pamatysite žemiau esantį ekraną.

Darbo su projektu IDX pradžia

Pasirinkite šabloną: pasirinksiu Gemini API šabloną.
Pavadinkite savo projektą: pavadinsiu jį „2024 m. bandymu“.
Pasirinkite aplinką: pasirinksiu „Vite“, kuri yra „JavaScript“ žiniatinklio programų aplinka.
Sukurkite projektą: paspauskite mygtuką Sukurti.

Po kelių minučių IDX viską sukurs už mus, o mes pamatysime savo šabloninius failus, kuriuos galėsime keisti kaip norime.

Šablono keitimas

Tai mūsų index.html failas. Galime jį modifikuoti taip, kaip mums patinka, bet pirmiausia pažvelkime į tai. Pradiniame šablone yra beveik viskas, ko mums reikia. Šiame šablone naudojamas Gemini 1,5 blykstės modelis, todėl mums jo daugiau nei pakanka.

Šablono keitimas

API rakto gavimas

Kaip matote, programa iš pradžių neveikia, nes pirmiausia turime gauti API raktą. Eikite į svetainę https://aistudio.google.com/app/apikey, ir gaukite raktą ten. Jei norite išsamių instrukcijų, kaip gauti API raktą, žiūrėkite kitą vaizdo įrašą apie projektą IDX.

Kai gausite raktą, nukopijuokite jį ir eikite į main.js failą. Pakeiskite rezervuotąją vietą savo API raktu.

API rakto gavimas

Programos testavimas

Patikrinkime, ar mūsų programa veikia. Paspauskite „Eiti“ ir pamatysite, ką Dvyniai mums grąžins.

Programos testavimas

Kaip matote, Dvyniai supranta, kas yra paveikslėlyje, ir siūlo keletą receptų, kaip kepti tokią kepyklėlę. Kadangi ši programa jau yra serveryje, galėsite bendrinti nuorodą arba atidaryti šią programą savo naršyklėje.

Programos testavimas

URL dar nėra gražus; tačiau pamatysite, kad viskas veikia, ir galėsite pasidalinti šia nuoroda su savo partneriais ar bendradarbiais.

Vaizdo įkėlimo funkcijos pridėjimas

Norėdami užbaigti AI vaizdo analizatorių, turime turėti galimybę pridėti savo vaizdą. Pataisykime šabloną; pirmas yra index.html failas:

Pakeiskite programos pavadinimą: pavadinsiu jį „AI vaizdo analizatoriumi“.
Ištrinti HTML: ištrinkite iš anksto nustatytus vaizdus. Eilutės nuo 14 iki 27.

<div class="image-picker">
 <label class="image-choice">
   <input type="radio" checked name="chosen-image" value="/baked_goods_1.jpg">
   <img src="/baked_goods_1.jpg">
 </label>
 <label class="image-choice">
   <input type="radio" name="chosen-image" value="/baked_goods_2.jpg">
   <img src="/baked_goods_2.jpg">
 </label>
 <label class="image-choice">
   <input type="radio" name="chosen-image" value="/baked_goods_3.jpg">
   <img src="/baked_goods_3.jpg">
 </label>
</div>

Pridėkite įvesties lauką vaizdams įkelti. 15 eilutė

<input type="file" id="fileInput" name="file">

Pakeiskite įvesties pavadinimo raginimo reikšmę į „Klauskite visko, ko norite apie šį vaizdą“.

Gautas HTML turėtų atrodyti taip, kaip paveikslėlyje žemiau.

Gautas HTML

„JavaScript“ atnaujinimas

Norėdami nuskaityti failą, turime apibrėžti JavaScript kodą. Atidaryk main.js failą ir atlikite šiuos pakeitimus:

Pašalinkite kodą iš 22–26 eilutės.

// Load the image as a base64 string
   let imageUrl = form.elements.namedItem('chosen-image').value;
   let imageBase64 = await fetch(imageUrl)
     .then(r => r.arrayBuffer())
     .then(a => Base64.fromByteArray(new Uint8Array(a)));

Pridėkite naują kodą, pradedant nuo 22 eilutės.

// Load the image as a base64 string
   const fileInput = document.getElementById('fileInput');
   const file = fileInput.files[0];


   const imageBase64 = await new Promise((resolve, reject) => {
     const reader = new FileReader();
     reader.readAsDataURL(file);
     reader.onload = () => {
       const base64String = reader.result.split(',')[1]; // Extract base64 part
       resolve(base64String);
     };
     reader.onerror = reject;
   });

Toliau pateiktoje ekrano kopijoje jūsų programa atrodys taip.

AI vaizdo analizatorius

Galutinis testavimas

Patikrinkime rezultatą. Įkelkite paveikslėlį, paklauskite, kas yra vaizde, ir paspauskite „Eiti“.

Mano paveikslo pavyzdys.

Mano paveikslo pavyzdys

Rezultatas:

Galutinis testavimas

Kaip matote, „Gemini“ API paaiškina viską apie vaizdą. Mūsų AI vaizdo analizatorius veikia!

Išvada

Viskas! Kaip matote, sukurti dirbtinio intelekto vaizdų analizatorių naudojant Project IDX ir Gemini API tikrai paprasta. Galite sukurti daugybę skirtingų programų. Tai tik vienas pavyzdys. Tikiuosi, kad šis straipsnis buvo naudingas ir informatyvus. Nepamirškite pasidalinti savo atsiliepimais toliau pateiktuose komentaruose.

Ačiū ir iki pasimatymo kituose mano straipsniuose! 🙂

Source link

Nuo nulio iki AI vaizdo analizatoriaus per 5 minutes: vadovas pradedančiajam

Darbo su projektu IDX pradžia

Šablono keitimas

API rakto gavimas

Programos testavimas

Vaizdo įkėlimo funkcijos pridėjimas

„JavaScript“ atnaujinimas

Galutinis testavimas

Išvada

„Applied Computing“ nori suteikti naftos ir dujų operatoriams AI modelį visai gamyklai

AI agentai sveikatos priežiūros operacijoms

BetAlice premija be užstato JK: išsamus vadovas

Kauno miesto savivaldybė Kauno abiturientų valstybinių brandos egzaminų rezultatai – vėl geriausi šalyje

Kauno miesto savivaldybė Dėl asfaltavimo darbų – eismo ribojimai Birželio 23-iosios gatvėje

Kauno miesto savivaldybė Kauno miesto savivaldybė skelbia pakartotinį Kauno miesto savivaldybei nuosavybės teise priklausančių viešosios įstaigos „Prisikėlimo projektai“ dalininko teisių pardavimą viešo aukciono būdu

Lietuvos banko valdyba patvirtino vartojimo kredito reguliavimo pakeitimus

Viena čili makaronų keptuvė

Kontaktai

Naujausi įrašai

Darbo su projektu IDX pradžia

Šablono keitimas

API rakto gavimas

Programos testavimas

Vaizdo įkėlimo funkcijos pridėjimas

„JavaScript“ atnaujinimas

Galutinis testavimas

Išvada

More Stories

Praleistos naujienos

Kontaktai

Žymos

Kategorijos

Naujausi įrašai