„Osećam da je to magija“: Novi AI model prepoznaje emocije, analizira zvuk, sliku i tekst

22:17, 14 Maj 2024

CC0 / Slika generisana veštačkom inteligencijom /

Kalifornijska kompanija za razvoj veštačke inteligencije Open AI predstavila je na svojoj veb stranici multimodalni model generativne veštačke inteligencije Dži-Pi-Ti-4o (GPT-4o), koji može da analizira zvuk, sliku i tekst u realnom vremenu.

Sputnik

Kompanija planira da ga uvede u svoje proizvode u narednim nedeljama.

Open AI ističe da je Dži-Pi-Ti-4o ("o" je oznaka za "omni", odnosno "sveobuhvatan") korak ka mnogo prirodnoj interakciji između čoveka i računara, pošto prihvata kao ulaz svaku kombinaciju teksta, zvuka i slike i generiše multimodalni odgovor.

"Ovo je prvi put da zaista pravimo ogroman korak napred kada je u pitanju jednostavnost korišćenja", istakla je tehnološka direktorka Open AI Mira Murati, prenosi Si-En-Bi-Si.

Novi AI model će umeti da prepozna i emocije u glasu korisnika, da brže i kvalitetnije nego ranije komunicira na 50 različitih jezika , kao i da značajno poboljša mogućnosti postojećeg četbota Čet Dži-Pi-Ti.

Izvršni direktor Open AI Sem Altman je ranije najavio na društvenoj mreži Iks da je kompanija "naporno radila" na nekim novim stvarima za koje misli da će se svideti ljudima.

"Osećam da je to magija", napisao je Altman.

Pogledajte i: