Kasmetinėje I/O konferencijoje Kalifornijoje „Google“ paskelbė keletą su AI susijusių pranešimų, įskaitant naujus modelius ir esamų atnaujinimus. Vienas iš įdomiausių pranešimų buvo „Project Astra“ – multimodalinis asistentas, veikiantis realiuoju laiku ir apjungiantis „Google Lens“ ir „Gemini“ galimybes teikti jums informaciją iš jūsų aplinkos.
Kaip veikia projektas Astra? Konferencijoje „Google“ pristatė ankstyvąją „Project Astra“ versiją, kuri veikia kaip kameros pagrindu veikiantis pokalbių robotas ir gali rinkti informaciją iš jūsų aplinkos, naudodamas jūsų įrenginio kamerą. Būdamas daugiarūšis AI asistentas, jis gali naudoti garsą, vaizdo įrašą ir vaizdus kaip įvestis ir pagal juos pateikti reikiamą išvestį. Jis veikia su Gemini 1.5 Pro modeliu, todėl jis yra neįtikėtinai galingas.
Pokalbių robotas realiu laiku analizuoja objektus ir aplinką ir gali labai greitai atsakyti į užklausas, todėl yra gana panašus į žmogaus padėjėją arba Tony Starko mylimąjį JARVIS. Projektas Astra taip pat veikia su nešiojamaisiais prietaisais, tokiais kaip išmanieji akiniai, o tai reiškia, kad yra daug galimybių dirbtinio intelekto pokalbių robotą integruoti į skirtingus įrenginius.
Projektas Astra gali geriau suprasti kontekstą, kuriame jis naudojamas, greičiau apdoroti informaciją ir išsaugoti ją, kad būtų galima greičiau ją prisiminti. Jo kalbos galimybės taip pat gerokai patobulintos, palyginti su ankstesnių „Gemini“ modelių kalbomis, todėl skamba natūraliau ir žmogiškiau.
Ką gali padaryti projektas Astra? Atrodo, kad trumpoje demonstracijoje, kurią parodė „Google“, „Project Astra“ gali padėti pasiekti daug. Jis gali stebėti ir suprasti objektus ir vietas per fotoaparato objektyvą ir mikrofoną bei suteikti jums informacijos apie juos. Pavyzdžiui, galite tiesiog nukreipti telefoną į kodo fragmentą ir aptarti jį su pokalbių robotu arba paprašyti jo identifikuoti objektą ir jo naudojimą.
Panašiai, dėl vietos suvokimo galimybių, Project Astra gali suteikti informacijos apie jūsų vietovę tiesiog pažvelgus į jūsų aplinką. Jis taip pat gali išsaugoti jam rodomą informaciją, kuri gali būti labai naudinga, jei norite rasti netinkamus daiktus, kaip parodyta demonstracinėje versijoje, kai ji padėjo vartotojui rasti akinius.
Taip pat galite paprašyti AI asistento kūrybinių idėjų, kaip ir su Gemini telefone. Pavyzdžiui, galite paprašyti sugalvoti dainos žodžius, muzikinės grupės pavadinimą ar dar ką nors. Iš esmės „Project Astra“ siekia būti universaliu AI padėjėju, galinčiu suteikti jums informaciją realiu laiku labai bendraujant.
Kada „Project Astra“ bus prieinamas? Kol kas „Google“ nepaskelbė apie „Project Astra“ prieinamumą. Demonstracinėje versijoje parodyta versija yra ankstyvas prototipas, tačiau „Google“ užsiminė, kad šios galimybės gali būti integruotos į esamą „Gemini“ programą vėliau.
Su „Project Astra“ „Google“ siekia vadovauti AI padėjėjų evoliucijai, kad jie taptų dar naudingesni ir lengviau naudojami. Tačiau „Google“ nėra vienintelė, siekianti šio tikslo. „OpenAI“ taip pat neseniai paskelbė apie GPT-4o, todėl „ChatGPT“ tapo daugiarūšiu, padidindamas jo galimybes ir efektyvumą. Naujasis „ChatGPT“ balso režimas (netrukus bus išleistas) taip pat gali naudoti vaizdo įvestį iš įrenginio kameros, kai bendrauja su vartotojais.
Šiuo metu skirtumas tarp šių dviejų yra tas, kad GPT-4o netrukus bus pasiekiamas visuose įrenginiuose, kuriuose veikia „ChatGPT“, o tikimasi, kad „Project Astra“ kada nors ateityje bus pasiekiamas kaip „Gemini Live“, nors šiuo metu nėra išleidimo datos. Kadangi GPT-4o maitinamas „ChatGPT“ buvo pasiekiamas anksčiau, belieka pamatyti, ar „Google“ projektas „Astra“ bus pakankamai geras, kad galėtų konkuruoti su populiaresniu „OpenAI“ pokalbių robotu.
Parašykite komentarą