Уровень развития систем искусственного интеллекта на данном этапе позволяет создавать модели, которые способны генерировать человекоподобные речевые паттерны. Это подтвердили британские специалисты из компании Sonantic, обучившие машину изменять интонацию и стиль речи в мельчайших деталях. Разработанная система в частности умеет воспроизводить "вздохи" и "охи", имитировать плач и смех.
Отражение реальности
Команда Sonantic работала над системой, которая смогла бы озвучивать героев голливудских фильмов и персонажей компьютерных игр. Широкий набор речевых инструментов позволит это делать весьма правдоподобно. В программу закладываются возможности для изменения тона, громкости и скорости речи.
Для демонстрации возможностей ИИ в рамках проекта "В чем ее секрет?" компания уже выпустила видео, на котором представлена актриса с наложенным искусственным голосом.
При создании этой речевой модели учитывались особенности поведения людей, применявших инструменты флирта и кокетства в реальной жизни. Например, нужный эффект позволяют достигнуть мягкая загадочная улыбка и медленный темп речи.
Психотерапевт и эксперт в области романтических отношений Мэгги Воган подтвердила, что разработанная система кокетки обладает ключевыми свойствами речи, которые присущи настоящему флиртующему разговору. По ее словам, показатели темпа и тона являются определяющими паттернами кокетливого голоса. Правдоподобности поведению добавляла и динамика происходящих изменений в дыхании, мимике и других характеристиках.
Тонкий подход
Для разработчиков современных систем ИИ уже давно не составляет проблемы создавать модели имитации эмоций и речи. Другое дело, что на данный момент они все же довольно поверхностны и грубы. Например, та же компания Sonantic успешно обучает свои системы выражать печаль и радость. Но флиртующая модель показала новый уровень более тонкого воспроизведения человеческих чувств в речевом аппарате. Одновременно нужно было сочетать несколько разноплановых оттенков голоса в связке с мимикой, что позволило добиться более реалистичных ощущений.
Произносимый монолог о любви заставляет зрителя поверить, что голос действительно принадлежит актрисе, а не компьютеру.
Сгенерированная компьютером речь
В Sonantic называют свою разработку аналогом популярных систем CGI - графических моделей, сгенерированных компьютером. Развитие этого направления может открыть и новые возможности для создания правдоподобных говорящих CGI, которые будут использовать широкий набор невербальных звуков с имитацией учащенного дыхания, смеха, плача и других тонких эмоций.
Позитивный опыт
За плечами команды Sonantic уже есть громкие и успешные разработки. Одна из самых ярких речевых моделей была представлена в прошлом году. Специалисты смогли воспроизвести голос Вэла Килмера, каким он был до заболевания горла. В 2014 году голос актера изменился до неузнаваемости после трахеотомии. Однако усилиями Sonantic речь Килмера смогли успешно сгенерировать с высокой степенью реализма. К слову, инструменты ИИ также помогают актеру общаться с окружающими и в личной жизни.
Был разработан универсальный речевой редактор, с помощью которого деятели кино и игровой индустрии могут создавать голосовые модели для своих героев и персонажей.
При этом у компании Sonantic есть серьезная конкуренция. Рынок генераторов компьютерных голосов активно развивается, вовлекая новых игроков. Например, к успешным работам в этой сфере можно отнести виртуальную версию молодого Люка Скайуокера, созданную Respeecher для сериала "Мандалорец".
Другие разработчики также идут по пути объединения компьютерных моделей людей с синтетическими голосами.
Нашли нарушение? Пожаловаться на содержание