Дело в эмоциональной окраске текста: ученые создали алгоритм, предсказывающий потенциальную популярность книг

Многие знаменитые книги до своего выхода в свет были сперва отвергнуты издательствами. На долю дебютного романа Голдинга Уильяма «Повелитель мух» выпал 21 отказ, первый труд Стейплза Льюиса Клайва о Нарнии не захотели публиковать 37 издательств, а «Гарри Поттер и философский камень» побывал в 12 редакциях до своего выпуска. Ученые Университета ИТМО и Университета Оулу, работающие с нейросетями и технологиями машинного обучения, решили выяснить, можно ли было избежать этого. Более подробно о новом исследовании, весьма важном для науки, вы узнаете далее.

Новое изыскание

Ученые попытались установить, есть ли объективные факторы, определяющие грядущую популярность художественного труда, и можно ли изготовить программу, предсказывающую шансы на успех. Для этого в своем изыскании они использовали маркеры 8 основных эмоций, выделенных иными экспертами в обособленный лексикон NRC Emotion Intensity Lexicon: доверие, грусть, удивление, отвращение, ожидание, гнев, радость, страх. И обучили алгоритм находить в книге именно такие слова. То есть алгоритм, не понимая сути текста, мог установить, какую он имеет эмоциональную окраску.

Что рассказал Иван Сметанников

«Мы взяли фрагмент книги и базу данных, где указаны маркеры разных эмоций, и проанализировали, - говорит Сметанников Иван, доцент факультета программирования и информационных систем Университета ИТМО. – В итоге каждый кусок теста получил 8 значений, каждое из которых совпадает с выражением той или иной эмоции. Интересно, что в известных книгах в жанре ужасов преобладает такая эмоция, как доверие. В детской литературе уровень доверия снижается ближе к финалу, а ожидание выходит вперед. В детективах в первых 10 % текста превалирует ожидание. После оно уходит вниз, а затем возвращается в финале. Так мы отчетливо видим кое-какие жанровые клише».

Изучив так весь текст, алгоритм может создать график, который эксперты именуют «эмоциональным следом» книги. После программа сопоставляет этот график с иными успешными трудами жанра и сообщает, понравится произведение любителям такой литературы или нет. Ученые сказали, что, несмотря на то что алгоритм предоставлял верное предсказание в 3 из 4 случаев, он все же не способен гарантировать успех книги.

Нашли нарушение? Пожаловаться на содержание

А вам интересны новые исследования ученых?
Комментарии 0
Подписаться
Я хочу получать
Правила публикации
Редактирование комментария возможно в течении пяти минут после его создания, либо до момента появления ответа на данный комментарий.