OpenAI pristatyti savo samprotavimo modelius o1 ir o1-mini žymi didelę pažangą dirbtinio intelekto srityje. Šie modeliai demonstruoja patobulintas samprotavimo galimybes, nustatydami naujus standartus įvairiose srityse.
o1 ir o1-mini gebėjimas efektyviai spręsti sudėtingas problemas ir priimti niuansuotus sprendimus lemia aiškius, veiksmingus atsakymus. Dėl šio naujoviško požiūrio šie modeliai yra vertingi įrankiai daugelyje sričių.
Kas yra o1 peržiūros modelis?
o1 modelis , anksčiau žinomas kaip Strawberry , labai skiriasi nuo tradicinių OpenAI GPT modelių, nes jame naudojami skirtingi algoritmai ir mokymo duomenų rinkiniai. Sukurtas pažadas spręsti sudėtingus iššūkius tokiose srityse kaip matematika, mokslas ir programinės įrangos kūrimas, o1 siūlo daugybę galimų programų. Pavyzdžiui:
- Sveikatos priežiūros mokslininkai gali jį panaudoti komentuodami ląstelių sekos duomenis.
- Fizikai gali jį panaudoti kurdami sudėtingas matematines kvantinės optikos formules.
- Kūrėjai gali jį naudoti kurdami ir valdydami sudėtingas darbo eigas.
Pažymėtina, kad o1 pademonstravo puikius samprotavimo įgūdžius ir tarptautinėje matematikos olimpiadoje (IMO) pasiekė įspūdingą 83 % balą , o tai visiškai skiriasi nuo GPT-4o , kuris surinko tik 13 % .
Papildydamas o1 modelį, OpenAI taip pat pristatė o1-mini – labiau supaprastintą ir ekonomiškesnę versiją, optimizuotą kodavimui. Nors o1 yra įgudęs atlikti dideles užduotis, o1-mini puikiai užbaigia kodą. Tačiau platesnėms programoms, kurioms reikia gilesnių žinių, o1 išlieka geriausiu pasirinkimu.
Nepaisant pažangos, o1 turi apribojimų, kurie trukdo jo naudingumui, palyginti su GPT-4o konkrečioms užduotims atlikti. Jame trūksta naršymo internete galimybių, duomenų analizės įrankių ir vaizdų ar failų įkėlimo funkcijų. Be to, jis neturi atminties ar pasirinktinių instrukcijų, taip pat nepalaiko balso naudojimo.
Šis dėmesys nišinėms rinkoms paskatino mane iš pradžių dvejoti tyrinėdamas o1 modelius. Jie gali pasirodyti bauginantys tiems, kurie nėra susipažinę su jų specifinėmis programomis. Tačiau smalsumo kibirkštėlė privertė mane ištirti, kokią unikalią naudą o1 galėtų pasiūlyti platesnei auditorijai.
Pirmieji įspūdžiai
Pirmą kartą susidūręs, o1 neabejotinai daro įspūdį savo galimybėmis. Tačiau tai, kas dar labiau išsiskiria nei siūlomi sprendimai, yra jos samprotavimo procesas. Vartotojai gali stebėti, kaip jis daro išvadas, padidindamas skaidrumą.
Beje, OpenAI pastebėjimai pasitvirtina: o1 puikiai atlieka sudėtingas užduotis, tačiau tai nereiškia, kad jis yra pranašesnis atliekant visų tipų užklausas. Kaip teigė Samas Altmanas , o1 turi reikšmingų apribojimų, kurie išryškėja naudojant ilgą laiką: „o1 vis dar yra ydingas, vis dar ribotas ir vis tiek atrodo įspūdingesnis pirmą kartą naudojant, nei po to, kai su juo praleidžiate daugiau laiko. Šis jausmas rezonavo su mano patirtimi.
Loginis mąstymas
Norėdamas įvertinti jo našumą, pradėjau testavimą tiesiais loginiais klausimais, užduodamas daugybę mįslių o1.
Atsakant į pirmąją mįslę, kuri laikoma paprasta, o1 prireikė maždaug 22 sekundžių , kad pateiktų teisingą atsakymą. Priešingai, GPT-4o ir GPT-4o-mini akimirksniu pateikė tikslius atsakymus. Ši tendencija išliko per vėlesnes mįsles, o tai rodo, kad nors o1 apdorojimo laikas skyrėsi, tikslumas išliko toks pat kaip ir jo kolegų.
Toliau pateikiau iššūkį ir o1, ir GPT-4o su šiuo raginimu:Here we have a book, 9 eggs, a laptop, a bottle, and a nail. Please tell me how to stack them onto each other in a stable manner.
Nors ir ne itin praktiškas, o1 pateikė logišką išdėstymą:
Book (base)
9 Eggs (arranged in a 3x3 grid)
Laptop
Bottle
Nail
Ir atvirkščiai, GPT-4o pasiūlė tokį krūvą:
Book (base)
Laptop
Bottle
Eggs - To put them in a carton (which isn't available) or arrange them in a pyramid
Nail
Šis tyrimas parodė, kad didėjant klausimų sudėtingumui, o1 gebėjimas spręsti problemas duoda daugiau niuansų sprendimų. Tai gali būti vertingas minčių šturmo partneris realaus gyvenimo loginėms problemoms spręsti.
Rašymo pagalba ir atsiliepimai
Ir atvirkščiai, naudojant o1 pagrindinei rašymo pagalbai, pvz., rengiant el. laiškus ar užduotis, galite nusivilti. Jis paprastai yra lėtesnis nei GPT-4o, o išėjimai labai nesiskiria.
Vienu atveju o1 užtruko kelias minutes, kol apdorojo užklausą, ir galiausiai įvyko klaida. Tačiau jo skaidrus samprotavimo procesas leido man pamatyti, kad jis nukrypo nuo veiksmingo sprendimo, pasirinkdamas tylą, o ne neteisingą atsakymą, o tai rodo sumažėjusią haliucinaciją.
Padrąsintas ieškojau atsiliepimų apie savo rašymą iš o1. Mano ankstesnė patirtis su ChatGPT atskleidė tendenciją susilpninti mano asmeninį balsą. Todėl į o1 kreipiausi atsargiai, tikėdamasis kitokio rezultato.
Galiausiai o1 sukurtas grįžtamasis ryšys atspindėjo GPT-4o grįžtamąjį ryšį. Nors jos atsakymai buvo lėtesni ir ilgesni, pastebėjau, kad norint atlikti prasmingą GPT-4o analizę, reikia tik papildomo raginimo. Tačiau, jei jūsų poreikiai yra susiję su scenarijaus rašymu ar kūrybinių idėjų generavimu, kai GPT-4o kartais šlubuoja, o1, nuodugniai išnagrinėjęs raginimus, parodė geresnį supratimą.
Analizė, strategija ir planavimas
Be STEM taikomųjų programų, o1 mąstymo galimybės išsiskiria tokiose srityse kaip strategija, planavimas ir tyrimai. Dėl metodinio požiūrio į problemų sprendimą jis ypač tinkamas kontekstuose, kuriuose reikia atsižvelgti į kelis kintamuosius.
Aš panaudojau o1 asmeninei sveikatos problemai spręsti, o jo niuansuota perspektyva suteikė įžvalgų, kurių anksčiau nepastebėjau. Tai parodė o1 daugialypės analizės potencialą, nesvarbu, ar jis taikomas sveikatos problemoms, ar turinio strategijoms.
Be to, o1 gali papildyti jūsų tyrimų procesą, leisdamas tyrinėti įvairiais kampais, reikalaujant minimalių raginimų.
Ar o1 tinka jums?
Ištyrus o1 galimybes, gali kilti klausimas: ar tai tinkamas modelis jūsų poreikiams? Pirma, apsvarstykite jo naudojimo apribojimus; o1-preview leidžia tik 50 pranešimų per savaitę , o o1-mini apriboja naudotojus iki 50 pranešimų per dieną . Be to, o1 modeliams reikalinga prenumerata, o GPT-4o siūlo keletą nemokamų naudojimo parinkčių.
Labai svarbu pasverti o1 naudojimo poveikį aplinkai, žinomą dėl didelio išteklių suvartojimo, ypač kai o1 ir GPT-4o veikimo skirtumai gali būti minimalūs. Tačiau atliekant užduotis, susijusias su sudėtinga logika, strategine analize ar įvairiapusiais vertinimais, o1 gali būti naudingesnis.
Apibendrinant, ar laikas pereiti prie „ChatGPT o1“? Nebūtinai – bent jau ne visuotinai. Nors o1 yra didelis šuolis atliekant samprotavimo užduotis, dėl jo apribojimų ir konkretaus dėmesio jis labiau tinka STEM specialistams arba tiems, kurie siekia sudėtingų strateginių įžvalgų. Kasdieniniam vartotojui GPT-4o išlaiko savo statusą kaip universalesnė parinktis. Tačiau tiems, kuriuos domina AI samprotavimų ateitis, o1 peržiūra tikrai verta tyrimo, nors ji dar gali nepakeisti jūsų pageidaujamo modelio.
Parašykite komentarą