„ChatGPT-4o“ yra neįtikėtinai geras, jis juoksis ir dainuos su jumis „vaizdo pokalbyje“

„ChatGPT-4o“ yra neįtikėtinai geras, jis juoksis ir dainuos su jumis „vaizdo pokalbyje“

Jei nekantriai laukėte naujausio „ChatGPT“ skirto „OpenAI“ pavasario atnaujinimo ir tikėjotės, kad įmonė išleis GPT-5, šiuo atžvilgiu būtumėte nusivylę. Tačiau tai, ką „OpenAI“ išleido vietoj to, tai daugiau nei kompensuotų.

Bendrovė neseniai pristatė savo naujausią pavyzdinį modelį – GPT-4o – ir tai yra žmogaus naujovių šedevras. „o“ GPT-4o reiškia „omni“ ir tai tinkamas linktelėjimas į naujausias „ChatGPT“ visur esančias galimybes. Nors intelekto ir samprotavimų dalis nėra daug patobulinta, palyginti su GPT-4 modeliu, naujasis modelis pasižymi drastiškais greičio ir daugiarūšiškumo patobulinimais.

Ką tai reiškia? GPT-4o patobulintos teksto, balso ir regėjimo galimybės. Jis gali geriau suprasti ir aptarti vaizdus. Tačiau įdomiausia naujinimo dalis yra galimybė su jumis kalbėtis realiuoju laiku per garso ir vaizdo įrašus, nuvesdami mus į žmogaus ir mašinos sąveikos ateitį. Daugelis iš mūsų tik įsivaizdavo šią mokslinės fantastikos sąveiką su dirbtiniu intelektu. Bet tai čia, ir tai jaudina.

Mira Murati, „OpenAI“ technologijų vadovė, kartu su dviem tyrimų vadovais pademonstravo naujas GPT-40 galimybes.

Balso modelis turi neįtikėtiną asmenybę ir toniškumą, galintis priversti jus pamiršti (tam tikrą laiką), kad bendraujate su AI. Tai siaubingai jaudina. Atsakymai daug natūralesni ir net juokiasi ir apsimeta, kad rausta kaip žmogus.

Demonstracinėje versijoje taip pat išryškėjo emocijų spektras, kurį „ChatGPT“ gali parodyti, kai buvo aiškiai paklaustas: pasakodama istoriją, „ChatGPT“ persmelkė savo balsą daugiau emocijų ir dramos, perjungė į robotinį garsą ir netgi dainavo kaip miuzikle, ir tai padarė. viskas sklandžiai.

Daugelis vartotojų sako, kad balsas jiems primena Scarlett Johansson AI iš filmo „Ji“, tačiau pažymėtina, kad tai tas pats balsas, kokį turėjo ChatGPT praeityje. Visas skirtumas atsiranda dėl tonacijos pokyčių ir kai kurių gerai išdėstytų juokų.

Kai susiejate jį su galimybėmis matyti ekrane rodomą turinį ir į jį reaguoti, tai tiesiog pribloškia. Turėdamas naujas matymo galimybes, „ChatGPT“ galėjo ne tik suvokti tokius dalykus kaip tiesinės lygtys, bet ir puikiai interpretavo aplinką bei emocijas, rodomas žmogaus veide naudojant fotoaparatą. Dabar netgi galite žaisti žirklėmis ir paprašyti ChatGPT būti teisėju arba žengti dar vieną žingsnį pasirengimo pokalbiui su ChatGPT paprašydami kritikuoti jūsų aprangą, o tai nepamins jūsų blogo pasirinkimo.

Apskritai, efektas yra nuostabus ir beveik leidžia patikėti, kad bendraujate su tikru asmeniu per vaizdo skambutį (jei kitas asmuo visą laiką buvo išjungęs fotoaparatą).

https://www.youtube.com/watch?v=DQacCB9tDaw

Balso modelis taip pat apskritai yra geresnis nei šiuo metu prieinamas. Dialogas vyksta labiau kaip natūralus pokalbis, kai galite jį nutraukti viduryje, jis gali suprasti ir atskirti kelis balsus ir foninius triukšmus bei balso toną.

Techniniu lygmeniu taip yra todėl, kad GPT-4o viską gali atlikti savaime, todėl iki šiol reikėjo trijų skirtingų modelių: transkripcijos, intelekto ir teksto į kalbą. Šie patobulinimai suteikia vartotojui labiau įtraukiančio, bendradarbiavimo patirtį, o ne ankstesnių modelių delsą.

Nors prieiga prie GPT-4o jau pradedama teikti nemokamiems ir „Plus“ naudotojams žiniatinklio programoje, naujasis balso režimas su GPT-4o ateinančiomis savaitėmis bus paleistas tik alfa versijos „ChatGPT Plus“ naudotojams. Taip pat išleidžiama nauja „MacOS ChatGPT“ programa, kurios prieiga bus teikiama nuolat, pradedant „ChatGPT Plus“ naudotojais.

Nors demonstracinė versija buvo gana įspūdinga, turėsime palaukti, kad pamatytume, ar realaus pasaulio programa bus tokia pat sklandi, kai modelis pagaliau bus išleistas.

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *