Искусственный интеллект синтезирует речь утративших голос людей

Шотландские программисты из компании Cereproc разработали компьютерную программу, которая может синтезировать голос людей, по разным причинам утративших способность говорить. При наличии аудиозаписи с образцом голоса человека нейросеть анализирует трек и воспроизводит его для генерации новых звуковых файлов.

Для привлечения внимания к своей технологии разработчики пошли на необычный эксперимент. Они решили вернуть речь американскому радиоведущему Джейми Дюпре, который потерял голос из-за редкого заболевания. Дюпре долгое время вел собственное шоу на радиостанции WSB Atlanta, но два года назад из-за дистонии мышц языка начал испытывать сложности в общении. Его дикция ухудшилась до такого состояния, что он не смог работать в эфире и стал заниматься редакторской работой.

Компания Cereproc предложила журналисту и его работодателю способ ведения программ с использованием возможностей современной техники. Тембр голоса радиоведущего был синтезирован на основе аудиозаписей из архива радиостанции. Большое количество файлов позволило нейронной сети проанализировать дикцию Дюпре и нюансы его речевого поведения. В результате была полностью воссоздана манера говорения человека, который на данный момент утратил способность внятно произносить слова.

Джеймс Дюпре смог вернуться к любимой работе в эфире. Теперь в ходе программы он набирает на компьютере текст, который хочет произнести, а искусственный интеллект преобразует напечатанные слова в стройную речь с учетом всех выявленных особенностей артикуляции. Синтез речи может производиться не только на стационарном компьютере, но и при помощи мобильных устройств.

Подобный принцип можно использовать и для генерации речи людей в обычной среде. Если человек не располагает записями своих разговоров или является немым от рождения, программисты предлагают подбирать звучание голоса, основываясь на желании пациента. Изобретением уже пользуются более 250 человек по всему миру.

Еще одним применением технологии стала генерация голосов умерших актеров и певцов. В связке с другими разработками программа может использоваться для воссоздания образов известных людей в фильмах и телевизионных шоу.