редакции Выбор
«Дочка» МТС выпускает нейросетевую модель с открытым кодом и донастройкой под бизнес-задачи
«Дочка» МТС MTS AI запускает языковую B2B-модель Cotype Nano с открытым кодом и возможностью настраивать под конкретные задачи. Об этом пишет «Коммерсант» со ссылкой на пресс-службу компании.
Как отмечает издание, это первый проект подобного рода от российской организации: «Яндекс» или «Сбер» не публиковали открытый код своих языковых моделей.
Известно, что в Cotype Nano использованы наработки другой свободной модели, Qwen 2.5 китайской Alibaba Cloud, а сама модель обучена на наборах данных, включающих программный код, математику и синтетические данные. С ее помощью можно генерировать тексты и переводы, а также разрабатывать собственные чат-боты.
Крупные российские компании, разрабатывающие большие языковые модели для бизнеса, до сих пор выпускали на рынок лишь проприетарные продукты — то есть с закрытым кодом без возможности создавать производные проекты. Обычно они работают в облачной инфраструктуре компании-разработчика, а доступ к ним предоставляется с помощью программного интерфейса (API), то есть посредством запросов к серверу.
Как считает старший программист-разработчик лаборатории нейронных систем и глубокого обучения МФТИ Джоксан Асокар, разработка проприетарных моделей позволяет компаниям сохранять контроль над своей интеллектуальной собственностью: «Это может дать им конкурентное преимущество». С другой стороны, цель открытых разработок — в создании более широкого сообщества, которое может активно участвовать в улучшении модели, добавил эксперт.
Собеседник «Коммерсанта» в крупной IT-компании напомнил, что основной вопрос в востребованности языковой модели кем-либо: «B2B-игрокам проще взять что-то более крупное по количеству параметров и дообучить самому». А конечным пользователям важен удобный интерфейс.
«Гораздо полезнее было бы открыть сообществу дата-сеты, на которых обучалась модель, если они действительно качественные», — прокомментировал эксперт.