Главное Авторские колонки Вакансии Образование
Выбор редакции:
😼
Выбор
редакции
482 0 В избр. Сохранено
Авторизуйтесь
Вход с паролем

«Дочка» МТС выпускает нейросетевую модель с открытым кодом и донастройкой под бизнес-задачи

Речь о B2B-модель Cotype Nano

«Дочка» МТС MTS AI запускает языковую B2B-модель Cotype Nano с открытым кодом и возможностью настраивать под конкретные задачи. Об этом пишет «Коммерсант» со ссылкой на пресс-службу компании.

Как отмечает издание, это первый проект подобного рода от российской организации: «Яндекс» или «Сбер» не публиковали открытый код своих языковых моделей.

Известно, что в Cotype Nano использованы наработки другой свободной модели, Qwen 2.5 китайской Alibaba Cloud, а сама модель обучена на наборах данных, включающих программный код, математику и синтетические данные. С ее помощью можно генерировать тексты и переводы, а также разрабатывать собственные чат-боты.

Крупные российские компании, разрабатывающие большие языковые модели для бизнеса, до сих пор выпускали на рынок лишь проприетарные продукты — то есть с закрытым кодом без возможности создавать производные проекты. Обычно они работают в облачной инфраструктуре компании-разработчика, а доступ к ним предоставляется с помощью программного интерфейса (API), то есть посредством запросов к серверу.

Как считает старший программист-разработчик лаборатории нейронных систем и глубокого обучения МФТИ Джоксан Асокар, разработка проприетарных моделей позволяет компаниям сохранять контроль над своей интеллектуальной собственностью: «Это может дать им конкурентное преимущество». С другой стороны, цель открытых разработок — в создании более широкого сообщества, которое может активно участвовать в улучшении модели, добавил эксперт.

Собеседник «Коммерсанта» в крупной IT-компании напомнил, что основной вопрос в востребованности языковой модели кем-либо: «B2B-игрокам проще взять что-то более крупное по количеству параметров и дообучить самому». А конечным пользователям важен удобный интерфейс.

«Гораздо полезнее было бы открыть сообществу дата-сеты, на которых обучалась модель, если они действительно качественные», — прокомментировал эксперт.

0
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.