Apple vijesti

Apple objavljuje pojedinosti o novom 'MM1' AI modelu

Appleovi istraživači razvili su novu metodu za obuku velikih jezičnih modela (LLM) koji besprijekorno integriraju i tekstualne i vizualne informacije.






Nalazi tvrtke, detaljno navedeni u istraživačkom radu pod naslovom ' MM1: Metode, analiza i uvidi iz multimodalnog LLM predosposobljavanja ,' pokazuju novi pristup stvaranju inteligentnijih i fleksibilnijih AI sustava. Upotrebom raznolikog skupa podataka koji se sastoji od parova slike-naslova, isprepletenih slikovno-tekstnih dokumenata i samo tekstualnih podataka, Apple tvrdi da model MM1 postavlja novi standard u AI-u sposobnost obavljanja zadataka kao što su opisi slika, vizualni odgovori na pitanja i zaključivanje prirodnog jezika s visokom razinom točnosti.

Appleovo istraživanje usredotočeno je na kombinaciju različitih vrsta podataka za obuku i arhitektura modela, što omogućuje umjetnoj inteligenciji razumijevanje i generiranje jezika na temelju mješavine vizualnih i lingvističkih znakova. Ova sposobnost je ključna za zadatke koji zahtijevaju nijansirano razumijevanje svijeta, kao što je tumačenje složenih slika ili odgovaranje na pitanja koja uključuju vizualne elemente.



Rad također naglašava iznimne mogućnosti učenja u kontekstu modela MM1, posebno u najvećoj konfiguraciji modela od 30 milijardi parametara. Ova verzija očito pokazuje izvanredne sposobnosti za razmišljanje u više koraka nad više slika koristeći nekoliko pokreta 'lanac misli', tehniku ​​koja omogućuje umjetnoj inteligenciji izvođenje složenog, otvorenog rješavanja problema na temelju minimalnih primjera.

Ovo istraživanje pojavljuje se kao dio Appleove šire inicijative za poboljšanje njegovih AI sposobnosti usred rastuće konkurencije. Ranije danas, Bloomberg 's Mark Gurman prijavio da Apple pregovara s Googleom o licenciranju Googleovih generativnih modela velikog jezika Gemini za pokretanje novih značajki koje dolaze u iPhone kao dio iOS 18 .