Маск анонсировал распознавание изображений в голосовом режиме чат-бота Grok

Эта функция распознавания изображений упростит взаимодействие с ИИ, позволяя ему считывать контекст запроса напрямую с картинки.
На текущем этапе нововведение находится в разработке: оно предоставляет доступ к камере, но пока не включает полноценное распознавание изображений. По данным пресс-службы xAI, интеграция визуальных возможностей в Grok — это шаг к усилению конкурентных позиций компании среди других ИИ-платформ. Однако стоит отметить, что голосовой режим пока не поддерживает пользовательские инструкции, что может ограничивать возможность контролировать ответы ИИ.
Хотя сроки полной реализации визуальной функции пока не объявлены, её появление на iOS указывает на то, что компания активно тестирует и совершенствует технологию.