Anthropic će sada otkriti kada su zahtjevi smanjeni ili odbijeni nakon kritika zbog skrivenih ograničenja
Američki div umjetne inteligencije Anthropic rekao je u srijedu da će zaštitne mjere koje upravljaju njegovim najnaprednijim modelima umjetne inteligencije učiniti transparentnijima, uključujući otkrivanje kada su korisnički zahtjevi smanjeni ili odbijeni. Ovaj potez uslijedio je nakon kritika zbog ograničenja koja prije nisu bila vidljiva korisnicima.
Prethodno je Anthropic mogao tiho usmjeravati zahtjeve koji uključuju područja kao što su kibernetička sigurnost, biologija i napredni razvoj umjetne inteligencije sa svog modela Fable 5 na manje sposobni Opus 4.8. Prema novim pravilima, korisnici će biti obaviješteni kada je zahtjev označen, dok će programeri aplikacijskih programskih sučelja (API) dobiti objašnjenja za svako odbijanje ili vraćanje na drugi model.
Pristup usmjeravanja nekih zahtjeva koji se odnose na granični razvoj umjetne inteligencije na manje sposoban model izazvao je kritike istraživača, koji su tvrdili da bi ograničenja mogla usporiti napredak na tom polju. Odgovarajući na reakciju, Anthropic je pristao učiniti zaštitne mjere vidljivima.
“Počevši od ovog tjedna, označeni zahtjevi vidljivo će se vratiti na Opus 4.8 – isto kao i naše zaštitne mjere za cyber i biografiju. Vidjet ćete to svaki put kad se dogodi. Na API-ju će svi označeni zahtjevi vratiti razlog odbijanja,” rekao je Anthropic.
Fable 5 javno je objavljen model iz Anthropicove klase Mythos, koji je tvrtka predstavila u travnju, ali je u početku zadržala, rekavši da su modeli u obitelji previše vješti u zaobilaženju zaštitnih mjera kibernetičke sigurnosti i preopasni za široku primjenu. Anthropic je objavio Fable 5 ovaj tjedan, govoreći o njegovim mogućnostima “nadmašuju one svih modela koje smo prethodno učinili opće dostupnima.”
U svojoj posljednjoj izjavi, Anthropic je rekao da će nastaviti degradirati neke zahtjeve prema politikama koje zabranjuju korištenje njegovih modela za izgradnju konkurentskih AI sustava, dodajući da su takva ograničenja standardna u industriji i ne utječu na većinu rada kodiranja i strojnog učenja.
Tvrtka je također navela nacionalnu sigurnost kao razlog odbijanja ili snižavanja nekih zahtjeva, rekavši da želi spriječiti strane protivnike da koriste njezinu tehnologiju za jačanje svojih AI sposobnosti.
“SAD i njegovi saveznici imaju prednost u graničnim čipovima i visoko optimiziranom softveru koji ih pokreće u punom potencijalu,” rekao je glasnogovornik tvrtke za Fortune. “Ove mjere zaštite osiguravaju da se Claude (Anthropicova obitelj AI modela) ne koristi za narušavanje te prednosti – optimiziranjem čipova koje su razvili ti protivnici, na primjer.”
Ovu priču možete podijeliti na društvenim mrežama:


