Kineski startup DeepSeek, koji je ove godine izazvao potres na tržištima, tiho je objavio nadograđenu verziju svog modela umjetne inteligencije za rezoniranje, izvještava CNBC. Tvrtka, naime, nije službeno objavila novost, ali je nadogradnja modela DeepSeek R1 postavljena na repozitorij AI modela Hugging Face.
Inače, DeepSeek je stekao veliku pozornost ove godine nakon što je njegov besplatni, otvoreni model R1 za rezoniranje nadmašio konkurente poput Mete i OpenAI-a. Niska cijena i kratko vrijeme razvoja šokirali su globalna tržišta te izazvali zabrinutost da američki tehnološki divovi previše troše na infrastrukturu, što je dovelo do pada vrijednosti dionica velikih američkih tehnoloških kompanija, uključujući AI lidera Nvidiju, za više milijardi dolara. Te su se kompanije u međuvremenu uglavnom oporavile.
Kao i kod prvog predstavljanja modela DeepSeek R1, i ova je nadogradnja objavljena bez pompe. Riječ je o modelu za rezoniranje, odnosno logično zaključivanje, što znači da AI može izvršavati složenije zadatke kroz logički, korak-po-korak misaoni proces. Nadograđeni model DeepSeek R1 trenutno se nalazi odmah iza OpenAI-evih modela za rezoniranje o4-mini i o3 na stranici LiveCodeBench, koja rangira modele prema različitim metrikama.
DeepSeek je postao simbol razvoja kineske umjetne inteligencije, koji se nastavlja unatoč pokušajima SAD-a da ograniči pristup Kine čipovima i drugim tehnologijama. Ovaj mjesec, kineski tehnološki divovi Baidu i Tencent otkrili su kako unaprjeđuju učinkovitost svojih AI modela kako bi se nosili s američkim ograničenjima na izvoz poluvodiča.
Direktor Nvidije Jensen Huang, čija tvrtka dizajnira grafičke procesorske jedinice (GPU-e) potrebne za treniranje velikih AI modela, oštro je kritizirao američke izvozne kontrole u srijedu. „SAD je svoju politiku temeljio na pretpostavci da Kina ne može proizvoditi AI čipove“, rekao je Huang. „Ta je pretpostavka oduvijek bila upitna, a sada je očito pogrešna.“ „Pitanje nije hoće li Kina imati AI“, dodao je Huang. „Ona ga već ima.“