Xiaomi представила мощную открытую ИИ‑модель для управления роботами и выходит на новый уровень робототехники

Эта система представляет собой открытую модель с 4,7 миллиарда параметров, созданную специально для управления роботами и объединяющую сразу несколько ключевых технологий — визуальное восприятие, обработку языка и генерацию физических действий.
Xiaomi‑Robotics‑0 построена по принципу VLA (Vision‑Language‑Action). Первый модуль, Visual Language Model (VLM), отвечает за восприятие окружающего мира и понимание команд на естественном языке — он распознаёт объекты и их взаимное расположение. Второй компонент, Action Expert, генерирует последовательности движений для роботов с высокой точностью и плавностью. Благодаря такой архитектуре модель способна не только «думать», но и действовать, что делает её ключевой частью будущих робототехнических систем.
Внутренние тесты показали, что Xiaomi‑Robotics‑0 превзошла около 30 других моделей в разных симуляторах, а в реальных экспериментах робот с двумя руками демонстрировал впечатляющую координацию движений и умение работать с различными объектами — от жёстких до гибких. Это демонстрирует, что система способна эффективно использовать свои способности не только в виртуальной среде, но и в практических задачах.
Отдельно стоит отметить, что Xiaomi пошла навстречу сообществу разработчиков и открыла доступ к модели: Xiaomi‑Robotics‑0 доступна с открытым исходным кодом, что может ускорить развитие робототехники и создать вокруг неё экосистему сторонних приложений и улучшений.
В целом, этот шаг означает, что Xiaomi выходит за рамки привычных устройств (смартфонов, гаджетов умного дома и телевизоров) и серьёзно инвестирует в технологии «воплощённого интеллекта», которые совмещают ИИ с реальным физическим взаимодействием роботов с окружающим миром.