„Осећам да је то магија“: Нови АИ модел препознаје емоције, анализира звук, слику и текст

22:17, 14 Мај 2024

CC0 / Слика генерисана вештачком интелигенцијом /

Калифорнијска компанија за развој вештачке интелигенције Опен АИ представила је на својој веб страници мултимодални модел генеративне вештачке интелигенције Џи-Пи-Ти-4о (ГПТ-4о), који може да анализира звук, слику и текст у реалном времену.

Sputnik

Компанија планира да га уведе у своје производе у наредним недељама.

Опен АИ истиче да је Џи-Пи-Ти-4о ("о" је ознака за "омни", односно "свеобухватан") корак ка много природној интеракцији између човека и рачунара, пошто прихвата као улаз сваку комбинацију текста, звука и слике и генерише мултимодални одговор.

"Ово је први пут да заиста правимо огроман корак напред када је у питању једноставност коришћења", истакла је технолошка директорка Опен АИ Мира Мурати, преноси Си-Ен-Би-Си.

Нови АИ модел ће умети да препозна и емоције у гласу корисника, да брже и квалитетније него раније комуницира на 50 различитих језика , као и да значајно побољша могућности постојећег четбота Чет Џи-Пи-Ти.

Извршни директор Опен АИ Сем Алтман је раније најавио на друштвеној мрежи Икс да је компанија "напорно радила" на неким новим стварима за које мисли да ће се свидети људима.

"Осећам да је то магија", написао је Алтман.

Погледајте и: