„Meta“ išleido „Llama 3.1“: kol kas galingiausią atvirojo kodo AI modelį

„Meta“ paskelbė apie „Llama 3.1“ – naujausio ir pažangiausio atvirojo kodo dirbtinio intelekto modelio – išleidimą. Ši nauja versija yra didelis šuolis į priekį dirbtinio intelekto technologijos srityje, o „Meta“ tvirtina, kad ji lenkia pirmaujančius patentuotus modelius iš tokių kompanijų kaip „OpenAI“.

Pavyzdinis Llama 3.1 405B modelis, pasižymintis 405 milijardais parametrų, dabar yra didžiausias viešai prieinamas pamatų modelis. Jis demonstruoja pažangiausias bendrųjų žinių, matematikos, įrankių naudojimo ir daugiakalbio vertimo galimybes. Modelis buvo apmokytas naudojant daugiau nei 15 trilijonų žetonų, naudojant daugiau nei 16 000 Nvidia H100 GPU.

Vienas iš pagrindinių „Llama 3.1“ patobulinimų yra išplėstas kontekstinis 128 000 žetonų ilgis, o tai 16 kartų viršija ankstesnių „Llama“ modelių talpą. Tai leidžia dirbtiniam intelektui apdoroti ir suprasti daug ilgesnes teksto dalis, o tai pagerina jo gebėjimą atlikti sudėtingas užduotis ir generuoti niuansingesnius atsakymus.

Naujasis modelis palaiko aštuonias kalbas: anglų, vokiečių, prancūzų, italų, portugalų, hindi, ispanų ir tajų. Dėl šios daugiakalbės galimybės „Llama 3.1“ yra universalus įrankis kūrėjams ir įmonėms, dirbančioms su pasauliniais AI programomis.

„Meta“ išleidžia trijų dydžių „Llama 3.1“: 405B , 70B ir 8B parametrus. Kiekvienas dydis yra optimizuotas įvairiems naudojimo atvejams:

405B modelis idealiai tinka įmonės programoms ir pažangiems tyrimams, galintis generuoti ilgos formos tekstą, versti įvairiomis kalbomis, koduoti ir atlikti sudėtingas samprotavimo užduotis.
70B modelis tinka turinio kūrimui, pokalbio AI ir kalbos supratimui.
8B modelis skirtas programoms su ribotais skaičiavimo ištekliais, pvz., mobiliesiems įrenginiams.

Siekdama palengvinti priėmimą, „Meta“ bendradarbiauja su didelėmis technologijų įmonėmis, tokiomis kaip „Amazon“, „Google“ ir „Databricks“, kad „Llama 3.1“ būtų prieinama įvairiose platformose. Pavyzdžiui, modeliai dabar pasiekiami „Amazon Web Services“ (AWS) naudojant tokias paslaugas kaip „Amazon SageMaker JumpStart“ ir „Amazon Bedrock“.

Markas Zuckerbergas, „Meta“ generalinis direktorius, pabrėžia atvirojo kodo AI svarbą, teigdamas, kad tai labai svarbu demokratizuoti AI naudą. Jis mano, kad atvirojo kodo modeliai, tokie kaip „Llama 3.1“, galiausiai pranoks patentuotus savo galimybėmis ir pritaikymo rodikliais.

„Llama 3.1“ išleidimas taip pat pateikiamas su atnaujinta licencija, leidžiančia kūrėjams naudoti modelio išvestis, kad patobulintų kitas AI sistemas. Tikimasi, kad šis žingsnis paspartins naujoves dirbtinio intelekto srityje ir suteiks kūrėjams daugiau lankstumo kuriant ir pritaikant AI programas.

„Meta“ įsipareigojimas kurti atvirojo kodo AI primena, kaip „Linux“ tapo dominuojančia atvirojo kodo operacine sistema daugeliui įrenginių ir serverių. Bendrovė tikisi, kad „Llama 3.1“ taip pat taps kertiniu AI plėtros akmeniu.

Kadangi dirbtinis intelektas ir toliau sparčiai vystosi, „Llama 3.1“ išleidimas žymi svarbų žingsnį siekiant padaryti galingus AI modelius labiau prieinamus kūrėjams ir įmonėms visame pasaulyje. Tai sukuria pagrindą naujai AI inovacijų erai, kai atvirojo kodo modeliai tiesiogiai konkuruoja su savo patentuotais analogais ir gali juos pranokti.