Категории: Новости

Сюрприз! ChatGPT оказался ужасным в Wordle

Чат-бот с искусственным интеллектом, известный как ChatGPT, разработанный компанией OpenAI, привлек внимание и воображение публики. Некоторые приложения этой технологии действительно впечатляют, например, ее способность обобщать сложные темы или участвовать в длинных беседах.

Неудивительно, что другие компании, занимающиеся искусственным интеллектом, спешат выпустить свои собственные большие языковые модели (LLM). ) — название технологии, лежащей в основе чат-ботов, таких как ChatGPT. Некоторые из этих LLM будут включены в другие продукты, такие как поисковые системы.

Учитывая его впечатляющие возможности, я решил протестировать чат-бота на Wordle — словесной игре из New York Times. – в которую я уже давно играю.

У игроков есть шесть попыток угадать слово из пяти букв. При каждом предположении игра указывает, какие буквы, если они есть, находятся в правильных позициях в слове.

Используя последнее поколение ChatGPT-4, я обнаружил, что его производительность при решении этих головоломок была на удивление низкой. .

Вы можете ожидать, что словесные игры будут проще простого для GPT-4. LLM «обучаются» тексту, то есть им предоставляется информация, чтобы они могли совершенствоваться в том, что они делают.

ChatGPT-4 был обучен примерно 500 миллиардам слов: вся Википедия, все общедоступные книги, огромные объемы научных статей и тексты со многих веб-сайтов.

Чат-боты с искусственным интеллектом могут сыграть важную роль в нашей жизни. Понимание того, почему ChatGPT-4 борется с Wordle, дает представление о том, как LLM представляют слова и работают со словами, а также о связанных с этим ограничениях.

Сначала я протестировал ChatGPT-4 на головоломке Wordle, где я знал правильные местоположения. из двух букв в слове. Шаблон был «#E#L#», где «#» представлял неизвестные буквы. Ответом было слово «мучнистый».

Пять из шести ответов ChatGPT-4 не соответствовали шаблону. Ответы были такими: «берилл», «дикий», «герал», «мерль», «пищать» и «жемчуг».

При других сочетаниях чат-бот иногда находил правильные решения. Но в целом получилось очень удачно. В случае слова, подходящего под шаблон «##OS#», было найдено пять правильных вариантов. Но когда шаблон был «#R#F#», он предлагал два слова без буквы F и слово — «Traff», которого нет в словарях.

Под капотом

В основе ChatGPT лежит глубокая нейронная сеть: сложная математическая функция или правило, которое сопоставляет входные данные с выходными. Входы и выходы должны быть числами. Поскольку ChatGPT-4 работает со словами, их необходимо «перевести» в числа, чтобы нейронная сеть могла с ними работать.

Перевод выполняется компьютерной программой, называемой токенизатором, которая поддерживает огромный список слова и последовательности букв, называемые «токенами».

Эти токены обозначаются номерами. Такое слово, как «друг», имеет идентификатор токена 6756, поэтому такое слово, как «дружба», разбито на токены «друг» и «корабль». Они представлены идентификаторами 6756 и 6729.

Когда пользователь вводит вопрос, слова преобразуются в числа еще до того, как ChatGPT-4 начнет обрабатывать запрос. Глубокая нейронная сеть не имеет доступа к словам в виде текста, поэтому она не может толком рассуждать о буквах.

Задание на стихотворение

ChatGPT-4 хорошо работает с первыми буквами слов. Я попросил его написать стихотворение, в котором первая буква каждой строки гласила: «Я люблю роботов». Его реакция была на удивление хорошей. Вот первые четыре строчки:

Я фанат шестеренок и стали

Люблю их движения, такие сюрреалистичные,

На трассах они быстро править

Соревнуются за знания, они не дураки,

Обучающие данные для ChatGPT-4 включают огромное количество учебников, которые часто включают алфавитные указатели. Этого могло быть достаточно для GPT-4, чтобы выучить ассоциации между словами и их первыми буквами.

Токенизатор, по-видимому, также был модифицирован для распознавания подобных запросов и, похоже, разбивает такие фразы, как » I Love Robots» на отдельные токены, когда пользователи вводят свой запрос. Однако ChatGPT-4 не смог обработать запросы на работу с последними буквами слов.

ChatGPT-4 тоже плохо работает с палиндромами. На просьбу составить фразу-палиндром о роботе он предложил «сот робота, орба», что не подходит под определение палиндрома и основано на непонятных словах.

Тем не менее, LLM относительно хорошо генерируют другие компьютерные программы. Это связано с тем, что их обучающие данные включают множество веб-сайтов, посвященных программированию. Я попросил ChatGPT-4 написать программу для определения пропущенных букв в Wordle.

Первоначальная программа, созданная ChatGPT-4, содержала ошибку. Он исправил это, когда я указал на это. Когда я запустил программу, она обнаружила 48 правильных слов, соответствующих шаблону «#E#L#», включая «tells», «cells» и «hello». Когда я ранее напрямую обращался к GPT-4 с просьбой предложить совпадения для этого шаблона, он нашел только одно.

Будущие исправления

Может показаться удивительным, что большая языковая модель, такая как ChatGPT- 4 с трудом решал бы простые словесные головоломки или формулировал палиндромы, поскольку обучающие данные включают почти все доступные ему слова.

Однако это связано с тем, что все вводимые тексты должны быть закодированы как числа, и процесс, который это делает, не фиксирует структуру букв в словах. Поскольку нейронные сети работают исключительно с числами, требование кодировать слова как числа не изменится.

Есть два способа, которыми будущие LLM смогут преодолеть это. Во-первых, ChatGPT-4 знает первую букву каждого слова, поэтому его обучающие данные можно дополнить, включив сопоставления положения каждой буквы в каждом слове в его словаре.

Второе — более интересное и общее решение. . Будущие LLM смогут генерировать код для решения подобных проблем, как я показал. В недавнем документе была продемонстрирована идея под названием Toolformer, в которой LLM использует внешние инструменты для выполнения задач, с которыми они обычно сталкиваются с трудностями, таких как арифметические вычисления.

Мы находимся на заре этих технологий, и идеи, подобные этому, текущие ограничения могут привести к еще более впечатляющим технологиям искусственного интеллекта. .gif?distributor=republish-lightbox-basic» alt=»Разговор» width=»1″ height=»1″ referrerpolicy=»no-referrer-when-downgrade»>

Майкл Г. Мэдден, заслуженный профессор компьютерных наук Университета Голуэя

Эта статья перепечатана из The Conversation под лицензией Creative Commons. Прочтите исходную статью.

Виктория Ветрова

Космос полон тайн...

Недавние Посты

Самая известная теория Эйнштейна только что преодолела самый большой вызов за всю историю

Математика, которую Альберт Эйнштейн разработал для описания гравитационного механизма физической Вселенной в начале 20 века,…

21.11.2024

Почти треть всех звезд может содержать остатки планет, подобных Земле

В последние годы астрономы разработали методы измерения содержания металлов в звездах с чрезвычайной точностью. Обладая…

20.11.2024

Новая технология печати ДНК может произвести революцию в том, как мы храним данные

Какими бы эффективными ни были электронные системы хранения данных, они не имеют ничего общего с…

19.11.2024

У этого странного кристалла две точки плавления, и мы наконец знаем, почему

В 1896 году немецкий химик Эмиль Фишер заметил нечто очень странное в молекуле под названием…

19.11.2024

Ученые впервые раскрыли форму короны черной дыры

Если вам посчастливилось наблюдать полное затмение, вы наверняка помните ореол яркого света вокруг Луны во…

19.11.2024

Ученые обнаружили галактики-монстры, скрывающиеся в ранней Вселенной

В ранней Вселенной, задолго до того, как они успели вырасти, астрономы обнаружили то, что они…

19.11.2024