Жасанды интеллект адамның дауысына еліктеуге үйретілді

Қытайдан келген ғалымдар машинада оқыту негізінде жұмыс істейтін Deep Voice технологиясын және қысқа үлгілер көмегімен дауысты тану жүйесін алдайтын технологияны жариялады. Ол 800 сағаттан астам ұзақтығы созылған дыбыстық жазба негізінде жаттығады, оның ішінде 2400-ге жуық түрлі дауыс. Әзірлеушілер айтқандай, нейрондық желіні тиімді пайдалану үшін шамамен 100 бес секундтық аудио сигналдар қажет.

Deep Voice бағдарламасы тембрді, дауыстық интонацияны имитациялай алады және оларды нақтыдан ажырата алмайды. Жасаушылардың айтуынша, ол сандық ассистенттер, бейне ойындар, дыбыс жазу және синхронды аударма үшін пайдаланылуы мүмкін. Бұдан басқа, сөйлеу мүмкіндігін жоғалтқан адамдарға қызмет етуі мүмкін. Ғалымдар «Deep Voice» дауысты өзгертуге қабілетті екендігін, әйелдің орнына оны еркекке айналдырып, оған шетелдік назар аудара алатындығын айтты.

«Бұл техникалық тұрғыдан шынайы серпіліс», — деді Лео Зудың авторларының бірі. «Біз ең күрделі генеративті мәселені шеше алдық, атап айтқанда, тірі сөйлеуді оның барлық ерекшеліктерімен синтездей алдық».
Бұл осы бағытта алғашқы жаңалық емес — канадалық әзірлеушілер бұрын Lyrebird атты дауыстық сервисті ұсынды. Ол барлық жеке сөйлеу сипаттамаларын қысқа мерзімге қысқартып, 1000 сөйлемді жарты секундта шығарады. мысалы, Шынжырлы жүгіру немесе құстың нақты түрлерін ән бар, ашулы күлкілі немесе симпатикалық үнін бейнелейді мүмкін — Ол сондай-ақ естіледі кез келген үй көшіруге қабілетті. Канада дамыту, сондай-ақ терең дауыс, дауыс көмекшілері, дыбыс және мүгедектігі бар адамдардың сөйлеу синтездеу үшін мультимедиялық өнімдер үшін пайдаланылады.

Алайда, канадалық және қытайлық әзірлеушілер технологияның жалпы проблемасы бар екенін атап көрсетеді: алаяқтар оны адамдарды алдау немесе сөйлеуді тану негізінде жұмыс істейтін бағдарламалар мүмкіндіктерін пайдалану үшін пайдалана алады. Адвокаттар сондай-ақ, осыған байланысты, жақын арада аудио жазбалар соттарда айтарлықтай дәлелдемелер болмайтынын қорқады.

https://hightech.fm