Как игры Pokémon помогают измерять прогресс искусственного интеллекта

Как игры Pokémon помогают измерять прогресс искусственного интеллекта

Несмотря на почти тридцатилетнюю историю, популярная видеоигра Pokémon Red продолжает привлекать внимание и фармацевтов отрасли искусственного интеллекта. В компании Anthropiс, разработчики нового ИИ-модуля Claude, решили проверить его возможности, заставив выполнить задачу по ловле покемонов в классическом игровом мире. Изначально это было просто развлечение, однако со временем проект приобрёл популярность внутри организации.

Особенностью нового ИИ, называемого Claude 3.7 Sonnet, является демонстрация прогресса в развитии искусственного интеллекта, который лучше отражает его способности, чем стандартные тесты и оценки. Представитель компании, исследователь Diane Penn, подчеркнула, что игры подобные Pokémon позволяют широкой аудитории понять реальные достижения в области ИИ и его потенциал для выполнения практических задач.

Несмотря на то, что ИИ уже превосходит человека в стратегических играх, таких как шахматы, го и StarCraft, игры с открытым миром типа Pokémon — это более реалистичный вызов, поскольку требуют не только знаний, но и навыков принятия решений и коммуникации с другими персонажами. Это демонстрирует возможность использования ИИ для решения реальных прикладных задач в повседневной жизни.

На сегодняшний день модель Claude демонстрирует успехи, побеждая в некоторых битвах, хотя ранее модели этого уровня боролись с трудностями при выходе из начальных локаций. Не менее впечатляющие результаты показывает система Google Gemini 2.5 Pro, которую в прямом эфире запустил энтузиаст, играющий в Pokémon Blue, где агент успешно прошел значительные этапы игры и достиг новых горизонтов, в том числе при помощи мини-карты для ориентации.

Также стоит отметить, что подобные исследования включают обучение ИИ в таких игровых и виртуальных средах, как Pokémon Go, Minecraft с населением из ИИ-агентов, что позволяет оценивать и расширять возможности ИИ в имитационных условиях.

Источник: @hiaimedia

Похожие новости

Почему технология 5G не оправдала ожиданий: анализ современного состояния

Роботы-хирурги, сервисы такси на основе робототехники, развитие метавселенных — все обещания новых технологий связывали с внедрением сети 5G. Однако, несмотря на затраты и активное продвижение, значимых прорывов в использовании 5G…

Российский рынок может лишиться WhatsApp: подготовка к ограничениям

Первый заместитель председателя ИТ-комитета Госдумы сообщил, что популярный мессенджер от компании Meta, скорее всего, войдёт в список нежелательного программного обеспечения на территории России. Этот список разрабатывается по поручению президента, и,…