OpenAI pristato pirmąją samprotavimo modelių seriją: o1 paleidimas

Kilus triukšmui, susijusiam su numatomu OpenAI Project Strawberry išleidimu, bendrovė pristatė savo naujausią modelį OpenAI o1. Nors oficialiai pavadintas „Strawberry“, šis leidimas pasižymi pažangiomis samprotavimo galimybėmis, kurios sukėlė daugybę spėlionių.

Be OpenAI o1, yra prieinamesnis variantas, vadinamas OpenAI o1 mini. Šis žingsnis tęsia OpenAI tendenciją išleisti mažesnius modelius, kad geriau palaikytų kūrėjus, po GPT-4o mini pristatymo.

Pavadinimas o1 reiškia naują pradžią, iš naujo nustatant pavadinimų sistemą, kuri buvo šiek tiek paini su ankstesniais modeliais.

Svarbu pažymėti, kad o1 eksploatacinės išlaidos yra didesnės, palyginti su esamais modeliais, ir lėtesnis atsako laikas. Tačiau dabartinė versija yra tik „peržiūra“, atspindinti jos ankstyvą vystymosi fazę.

„OpenAI o1“ labai skiriasi nuo GPT modelių ir gali pasigirti unikalia mokymo metodika, kurioje naudojamas naujas optimizavimo algoritmas ir duomenų rinkinys.

Šis naujoviškas modelis puikiai sprendžia sudėtingas problemas tokiose srityse kaip mokslas, kodavimas ir matematika, pasitelkdamas patobulintą samprotavimą. „OpenAI o1“ naudoja sustiprinimo mokymąsi problemoms spręsti, įtraukdama atlygio ir bausmės mechanizmą. Skirtingai nuo ankstesnių modelių, kurie pirmiausia numatė kitą žodį, o1 integruoja „minčių grandinę“, skatinančią efektyviai atsakyti į užklausas. Ši pažanga reiškia reikšmingą žingsnį siekiant į žmogų panašaus intelekto, dėl kurio pagerėja tikslumas ir sumažėja polinkis į haliucinacijas (nors vis dar dažnai pasitaiko netikslumų).

Kai pateikiamas raginimas, o1 suformuluoja savo mąstymo procesą, parodydamas reikšmingus samprotavimo galimybių patobulinimus, palyginti su ankstesniais modeliais. Pavyzdžiui, o1 tarptautinėje matematikos olimpiadoje (IMO) surinko įspūdingą 83 % balą, o GPT-4o – tik 13 %.

Nepaisant gebėjimo samprotauti ir dalytis savo mąstymo procesais, mąstymo laikas yra ribotas. Vartotojai gali gauti raginimą, pavyzdžiui: „O, man baigiasi laikas; leiskite man greitai gauti atsakymą“, – pranešė „The Verge“.

Nors o1 puikiai sprendžia sudėtingas problemas, reikalaujančias plačių bendrųjų žinių, o1 mini geriau tinka kodavimo, matematikos ir mokslinėms užduotims, kurioms nereikia plataus bendrųjų žinių supratimo. Be to, o1 mini yra žymiai pigesnis, beveik 80 % pigesnis nei o1.

Šiuo metu o1 trūksta GPT-4o funkcijų, tokių kaip naršymas internete arba failų / vaizdų priėmimas kaip įvestis, nors OpenAI aktyviai stengiasi įtraukti šias galimybes. o1 modeliai yra specialiai sukurti vartotojams, kuriems reikia sudėtingų problemų sprendimų, įskaitant sveikatos priežiūros tyrėjus, fizikus, ekonomistus ir programinės įrangos kūrėjus.

Kas gali pasiekti modelį? Nuo šiandien „ChatGPT Plus“ ir „Team“ vartotojai gali pasiekti „o1-preview“ ir „o1-mini“. Edu ir Enterprise vartotojai galės pasiekti kitą savaitę. „ChatGPT Free“ plano naudotojai neturės tiesioginės prieigos, tačiau „OpenAI“ siekia suteikti o1-mini prieigą nemokamiems vartotojams ateityje.

Abiejų modelių naudojimo apribojimai yra 30 savaitinių pranešimų o1 ir 50 o1-mini, o ateityje šiuos apribojimus planuojama padidinti.

Kalbant apie kainas, o1 API yra gana brangi; o1 peržiūra kainuoja 15 USD už milijoną įvesties žetonų ir 60 USD už milijoną išvesties žetonų. Priešingai, GPT-4o kainuoja 5 USD už milijoną įvesties žetonų ir 15 USD už milijoną išvesties žetonų.

Kaip pasiekti modelius? Naudotojai gali perjungti o1 ir o1-mini iš ChatGPT meniu. „OpenAI“ ateityje taip pat siekia automatizuoti modelių pasirinkimą pagal vartotojo nurodymus.

o1 ir o1-mini pristatymas pabrėžia OpenAI įsipareigojimą diegti naujoves ir išskiria jį iš konkurentų. Jei modelis gali sėkmingai atlikti sudėtingas samprotavimo užduotis, tai gali būti reikšminga pažanga siekiant dirbtinio bendro intelekto (AGI). Tačiau kai kurie pirminiai atsiliepimai rodo, kad o1 gali susidurti su pagrindinėmis samprotavimo užduotimis.

Naujajam O1 vis dar apgailėtinai nepavyksta atsakyti į trivialius u/knowledgehacker klausimus
ChatGPT

„OpenAI“ ir toliau plėtojant o1 seriją, vartotojai vis dar tikisi, kad būsimi atnaujinimai pagerins modelio našumą. Be to, „OpenAI“ planuoja ir toliau diegti naujus GPT serijos modelius, išlaikydama lūkesčius dėl galimo GPT-5.

Šaltinis