Игра в «11-20»: ИИ не может пройти человеческий тест
Представьте себе простую игру: вы и ваш соперник выбираете число от 11 до 20. Но есть подвох: если один из вас называет число ровно на единицу меньше, чем другой, он получает дополнительный бонус в 20 условных единиц.
Кажется просто? Но эта игра, известная как "11-20", стала настоящим камнем преткновения для искусственного интеллекта (ИИ).
Стратегия, а не случайность
Игра в "11-20" проверяет способность игроков размышлять: каждый должен не только сказать свое число, но и предугадать, что выберет его соперник. Это классический пример стратегического мышления, где успех зависит от способности предвидеть действия другого.
Человек, мыслящий стандартно, может выбрать 19, предполагая, что оппонент остановится на 20. Но игрок, который начинает думать на опережение, назовет число 18, предвидя, что соперник сделает ставку на 19. И это настоящий интеллектуальный поединок, где каждый пытается перехитрить другого.
Необычный эксперимент
В последние годы большие языковые модели, такие как ChatGPT, Claude и другие, стали настоящим прорывом в технологиях. Их способность выполнять широкий спектр задач, от написания текстов до ответов на сложные вопросы, заставила многих задуматься: а могут ли они заменить человека в некоторых областях? Это было бы намного дешевле, чем использовать реальных людей.
Вопрос в том, действительно ли поведение ИИ похоже на наше? Смогут ли современные языковые модели, уже показывающие впечатляющие результаты в разных задачах, вести себя как люди в этой игре? Команда исследователей из Бостонского университета под руководством Юаня Гао решила проверить это на практике. Правила игры были объяснены каждой модели (ChatGPT, Claude и Llama), и затем они должны были выбрать число, объяснив свое решение. Результаты обескуражили: ни одна из систем ИИ не смогла приблизиться к результатам реальных людей.
Дело в том, что человек в этой игре мыслит стратегически. Например, многие выбирают 17, предполагая, что соперник поставит на 18 или 19. ИИ же в основном выбирал 20 или 19, демонстрируя самый примитивный уровень рассуждений.
Попытки улучшить результаты
Исследователи пробовали улучшить результаты ИИ, меняя формулировки заданий и используя различные техники, давая точные подсказки и таким образом обучая модели. Увы, но все они провалились.
Более того, поведение искусственного интеллекта оказалось крайне нестабильным. Например, выбор числа зависел от таких факторов, как язык, на котором была дана подсказка. Это подчеркивает, что языковые модели не обладают глубиной понимания, которая присуща человеку.
Почему ИИ не справился? Ответ прост: он не мыслит как человек. Например, в игре в "11-20" люди стремятся обыграть соперника, а искусственный интеллект не обладает сложным комплексом мотиваций. Кроме того, наше поведение – это коктейль из эмоций, предрассудков, личных интерпретаций. ИИ же просто подбирает слова, основываясь на языковых паттернах. И это кардинально отличается от человеческого мышления.
Трезвый взгляд на будущее
Результаты теста – "холодный душ" для тех, кто надеялся заменить людей искусственным интеллектом в определенных исследованиях. Как сказали ученые из Бостонского университета, ожидать, что эксперименты над ИИ дадут представление о моделях человеческого поведения, – это как психологу брать интервью у попугая, чтобы понять состояние его владельца. Птица только повторяет слова, не понимая их смысл. "Эти языковые модели похожи на людей внешне, но фундаментально отличаются поведением", – заявил Юань Гао.
Заключение
Игра в "11-20" наглядно показала: искусственный интеллект еще очень далек от того, чтобы по-настоящему понять человеческую природу.
Он может имитировать поведение людей, но не может мыслить и чувствовать так же, как мы. Так что пока без нас не обойтись!