Microsoft je u ponedjeljak objavio MAI-Image-1, njihov prvi model za generiranje slika razvijen potpuno interno, koji ulazi među 10 najboljih modela “tekst u sliku” na LMArena. MAI-Image-1 oblikovan je povratnim informacijama kreativnih profesionalaca kako bi se izbjegli ponavljajući ili generički stilizirani rezultati.
“U Microsoft AI-ju stvaramo umjetnu inteligenciju za svakoga, podršku i pomoć koja uvijek stoji u službi čovječanstva. Rekli smo kako su modeli osmišljeni baš za određene svrhe ključni za ovu misiju i u kolovozu smo predstavili prva dva interna modela. MAI-Image-1 označava sljedeći korak na našem putu i otvara vrata za još impresivnije, kreativnije i dinamičnije doživljaje unutar naših proizvoda”, pišu u objavi na svojoj službenoj stranici.
Ističu kako su trenirali ovaj model s ciljem pružanja stvarne vrijednosti kreativcima, vodeći računa da izbjegnu ponavljanja ili generičke stilove. “Prioritet nam je rigorozni odabir podataka i nijansiranim evaluacijama usmjerenim na zadatke koji vjerno oponašaju stvarne kreativne scenarije, uključujući povratne informacije profesionalaca iz kreativnih industrija. Ovaj model je dizajniran kako bi pružio realnu fleksibilnost, vizualnu raznolikost i praktičnu upotrebljivost”, pišu.
Iz Microsofta navode da su tražili povratne informacije od profesionalaca iz kreativnih industrija kako bi izbjegli „ponavljajuće ili generički stilizirane rezultate“. Tvrtka tvrdi da MAI-Image-1 izvrsno generira fotorealistične prikaze, primjerice osvjetljenja, krajolika i drugih motiva. Također može obrađivati zahtjeve i stvarati slike brže od „većih, sporijih modela“.
Model je već zauzeo mjesto među 10 najboljih na LMArena, mrežnoj platformi za usporedbu AI sustava, gdje ljudi međusobno uspoređuju rezultate različitih modela i glasaju za one koji daju najbolje slike.
Isprobali smo i sami MAI-Image-1 generator slika. Iako na prvu izgleda podosta realistično, njihov model također još nedovoljno dobro prikazuje slova na hrvatskom jeziku.
 
			 
			 
					
 
							