Всё ближе к человеку: ИИ запросто сможет сымитировать ваш голос

По инф. hightech.fm

15.01.2023

Компания Microsoft представили искусственный интеллект VALL-E. Он может генерировать голосовые записи на основе трехсекундного образца. Исследование показало, что модель, обученная на основе множества коротких отрывков, генерирует английскую речь, которую невозможно отличить от голоса оригинала.

Исследователи из Корнуэльского университета использовали модель VALL-E для анализа механизмов генерации речи. В своей работе, препринт которой опубликован на сервере arXiv, ученые исследуют нейронную сеть, обученную на основе 60 тыс. часов английской речи. Это в сотни раз больше, чем у существующих аналогов.

Анализ показал, что системе достаточно трехсекундного ролика для имитации голоса собеседника. При этом Vall-E значительно превосходит современную систему TTS с точки зрения естественности звучания речи и сходства голоса. Кроме того, она может сохранять эмоции говорящего и акустическую среду (влияние акустических свойств помещения, в котором была сделана оригинальная запись).

Разработанная система генерации пока закрыта для публичного доступа, но исследователи опубликовали примеры образцов и готовых голосовых файлов на сайте в интернете. Примеры сгенерированной речи отличаются по качеству. В то время как некоторые из них звучат естественно, на других слышно, что они сгенерированы машиной. Авторы разработки отмечают, что дальнейшее обучение на разных голосах, в том числе с разными акцентами, повысит качество работы системы.

Исследователи также отмечают, что возможность генерации голосов, идентичных оригинальным, создает новые вызовы для безопасности, поскольку может использоваться мошенниками. Они полагают, что до широкого публичного релиза модели необходимо разработать систему, которая будет распознавать записи, сгенерированные ИИ.

Ещё кое-что о науке:

По инф. hightech.fm

ЛЮДЯМ ТАКЖЕ ИНТЕРЕСНО:

Европейской части России предстоит пережить аномальную жару

В ближайшее время большая часть европейской территории России столкнется с экстремально высокими температурами. Такое предупреждение сделал Роман Вильфанд, научный руководитель Гидрометцентра.

Заглядывая на пять лет вперед: какие профессии будут востребованы?

По словам руководителя учебно-методического отдела IT-колледжа MAXITET Елены Провозен, некоторым специальностям лучше учиться уже сейчас. Об этом она рассказала RT.

Что нового говорит наука о правильной чистке зубов?

Гражданам дали советы по поддержанию гигиены полости рта. Стало известно, сколько раз в день нужно чистить зубы и какие щетки и пасту лучше использовать.

Какое время для тренировок — лучшее? Мнение эндокринолога

По мнению эндокринолога Зухры Павловой, утренние тренировки приносят больше пользы, чем вечерние. Она рекомендовала заниматься спортом в течение часа-двух после пробуждения или в дневное время.

Данные эндокринолога: какая еда перед сном вызывает кошмары?

Ужин перед сном, включающий определенные продукты, вызывает кошмары. Об этом заявила врач-эндокринолог Зухра Павлова, пост опубликован в Telegram-канале.

Тэги: