NVIDIA ускорила китайские ИИ‑модели в 10 раз

Сервер, о котором идёт речь, объединяет 72 мощных чипа с очень быстрой связью между ними — именно это, согласно NVIDIA, даёт столь значительный прирост производительности по сравнению с предыдущим поколением.
Особенно это касается моделей с архитектурой «mixture‑of‑expert» (MoE) — подхода, при котором разные «эксперты» модели обрабатывают разные задачи, что делает вычисления более гибкими и эффективными. Этот метод активно используется разработчиками, включая Moonshoot AI и DeepSeek.
По словам NVIDIA, хотя такие модели требуют меньше ресурсов на обучение, их новые сервера остаются ключевыми для массового развёртывания: они способны обслуживать запросы от миллионов пользователей одновременно.
Это ещё раз подчёркивает, что NVIDIA продолжает доминировать на рынке ИИ‑инфраструктуры, предоставляя технологию, необходимую для реального использования сложных ИИ‑моделей — не только на бумаге, но и в продуктиве.