ИИ испытывают на игре Super Mario

Наиболее впечатляющие результаты продемонстрировали Claude 3.7 и Claude 3.5 от Anthropic, в то время как Gemini 1.5 Pro от Google и GPT-4o от OpenAI показали меньшую эффективность.
Игровой процесс был запущен через эмулятор и интегрирован с GamingAgent, разработанной Hao AI Lab платформой, которая предоставляет ИИ основные указания, например, избегать столкновений с преградами. Затем ИИ генерирует команды на языке Python для управления действиями в игре.
В лаборатории отметили, что модели, ориентированные на рассуждения, такие как o1 от OpenAI, показали менее убедительные результаты по сравнению со стандартными версиями, что объясняется задержками в принятии решений, критичными в динамичном мире Super Mario Bros.