Вештачкој интелигенцији потребно 15 секунди нечијег гласа да генерише савршен клон

20:01, 30 Март 2024

CC0 / Pexels/Tara Winstead /

ОпенАИ је представио „Војс Енџин“, револуционарну АИ платформу за претварање текста у говор. Кроз гласовни снимак од само 15 секунди, ова најновија ОпенАИ иновација може да синтетизује реалистичан глас способан да чита текст на више језика, што би могло да има огроман утицај на различите индустрије.

Sputnik

ОпенАИ-јев пост на блогу наглашава важност прелиминарних имплементација у обликовању етичких разматрања и истраживања у различитим апликацијама.

Значајни корисници ове технологије укључују компаније Age of Learning, Dimagi, Livox i Lifespan као и HeyGen AI видео генератор, од којих сваки користи „Војс Енџин“ у различите сврхе. Age of Learning га, на пример, користи за генерисање унапред припремљеног гласовног садржаја и испоруку персонализованих одговора ученицима.

Развој „Војс Енџин“-а датира од 2022. године, а његова еволуција је кулминирала у унапред подешеним гласовима за АПИ, за претварање текста у говор и ЧетГПТ-ову функцију „Рид Алауд“. Џеф Харис из ОпенАИ тима за производе открио је да је модел прошао обуку на основу мешавине лиценцираних и јавно доступних података, наглашавајући његову чврсту основу.

Гласовна АИ технологија се шири

Пејзаж звука генерисаног вештачком интелигенцијом наставља да се шири, а „Војс Енџин“ означава значајан корак у том развоју. Међутим, етичка разматрања су велика, као што показује недавни мандат америчког ФЦЦ-а који забрањује гласовне позиве са вештачком интелигенцијом, што је упозоравајућа прича која одражава забринутост коју је изнео сам ОпенАИ.

ОпенАИ партнерство предвиђа поштовање строгих правила коришћења, укључујући добијање изричитог пристанка од оригиналног говорника, уздржавање од лажног представљања и откривање АИ порекла слушаоцима. Водени жиг даље обезбеђује следљивост и одговорност у коришћењу звука, одражавајући проактиван став ОпенАИ у ублажавању потенцијалне злоупотребе.

Постоји низ предлога за ублажавање ризика повезаних са гласовном технологијом вођеном вештачком интелигенцијом, укључујући мере као што су постепено укидање гласовне аутентификације за банкарство, јаке политике које штите индивидуалне гласове, повећана свест јавности о дубоким лажњацима вештачке интелигенције и развој свеобухватног праћења система за садржај генерисан АИ.

Кроз проактивне мере и заједничке напоре, трансформативни потенцијал „Војс Енџин“ -а може се одговорно искористити, најављујући нову еру у интеракцији човека и машине, преноси портал The Verge.

Погледајте и: