Искусственный интеллект обучили изменять интонацию и стиль, а также использовать "вздохи" и "охи" в речи

Уровень развития систем искусственного интеллекта на данном этапе позволяет создавать модели, которые способны генерировать человекоподобные речевые паттерны. Это подтвердили британские специалисты из компании Sonantic, обучившие машину изменять интонацию и стиль речи в мельчайших деталях. Разработанная система в частности умеет воспроизводить "вздохи" и "охи", имитировать плач и смех.

Отражение реальности

Команда Sonantic работала над системой, которая смогла бы озвучивать героев голливудских фильмов и персонажей компьютерных игр. Широкий набор речевых инструментов позволит это делать весьма правдоподобно. В программу закладываются возможности для изменения тона, громкости и скорости речи.

Для демонстрации возможностей ИИ в рамках проекта "В чем ее секрет?" компания уже выпустила видео, на котором представлена актриса с наложенным искусственным голосом.

При создании этой речевой модели учитывались особенности поведения людей, применявших инструменты флирта и кокетства в реальной жизни. Например, нужный эффект позволяют достигнуть мягкая загадочная улыбка и медленный темп речи.

Психотерапевт и эксперт в области романтических отношений Мэгги Воган подтвердила, что разработанная система кокетки обладает ключевыми свойствами речи, которые присущи настоящему флиртующему разговору. По ее словам, показатели темпа и тона являются определяющими паттернами кокетливого голоса. Правдоподобности поведению добавляла и динамика происходящих изменений в дыхании, мимике и других характеристиках.

Тонкий подход

Для разработчиков современных систем ИИ уже давно не составляет проблемы создавать модели имитации эмоций и речи. Другое дело, что на данный момент они все же довольно поверхностны и грубы. Например, та же компания Sonantic успешно обучает свои системы выражать печаль и радость. Но флиртующая модель показала новый уровень более тонкого воспроизведения человеческих чувств в речевом аппарате. Одновременно нужно было сочетать несколько разноплановых оттенков голоса в связке с мимикой, что позволило добиться более реалистичных ощущений.

Произносимый монолог о любви заставляет зрителя поверить, что голос действительно принадлежит актрисе, а не компьютеру.

Сгенерированная компьютером речь

В Sonantic называют свою разработку аналогом популярных систем CGI - графических моделей, сгенерированных компьютером. Развитие этого направления может открыть и новые возможности для создания правдоподобных говорящих CGI, которые будут использовать широкий набор невербальных звуков с имитацией учащенного дыхания, смеха, плача и других тонких эмоций.

Позитивный опыт

За плечами команды Sonantic уже есть громкие и успешные разработки. Одна из самых ярких речевых моделей была представлена в прошлом году. Специалисты смогли воспроизвести голос Вэла Килмера, каким он был до заболевания горла. В 2014 году голос актера изменился до неузнаваемости после трахеотомии. Однако усилиями Sonantic речь Килмера смогли успешно сгенерировать с высокой степенью реализма. К слову, инструменты ИИ также помогают актеру общаться с окружающими и в личной жизни.

Был разработан универсальный речевой редактор, с помощью которого деятели кино и игровой индустрии могут создавать голосовые модели для своих героев и персонажей.

При этом у компании Sonantic есть серьезная конкуренция. Рынок генераторов компьютерных голосов активно развивается, вовлекая новых игроков. Например, к успешным работам в этой сфере можно отнести виртуальную версию молодого Люка Скайуокера, созданную Respeecher для сериала "Мандалорец".

Другие разработчики также идут по пути объединения компьютерных моделей людей с синтетическими голосами.

Нашли нарушение? Пожаловаться на содержание

А как бы вы применяли такие системы в бытовой жизни?
Комментарии 0
Подписаться
Я хочу получать
Правила публикации
Редактирование комментария возможно в течении пяти минут после его создания, либо до момента появления ответа на данный комментарий.