Китайская компания DeepSeek представила одну из первых «рассуждающих» ИИ-моделей
DeepSeek , китайская исследовательская компания по искусственному интеллекту, финансируемая количественными трейдерами, выпустила предварительную версию искусственного интеллекта DeepSeek-R1, которая, по утверждению фирмы, представляет собой модель, конкурирующую с o1 от OpenAI. Об этом пишет TechCrunch.
В отличие от большинства моделей, рассуждающие способны эффективно проверять факты, тратя больше времени на обработку запроса. Как и o1, DeepSeek-R1 решает задачи, планируя наперед и выполняя последовтельность действий, которые помогают модели прийти к ответу. В зависимости от сложности вопроса DeepSeek-R1 может «думать» десятки секунд, прежде чем ответить.
В DeepSeek утверждают, что DeepSeek-R1 работает на двух популярных тестах ИИ, AIME и MATH. AIME использует другие модели ИИ для оценки производительности модели, в то время как MATH представляет собой набор текстовых задач. Но модель не идеальна. Некоторые комментаторы соцсети X отметили, что DeepSeek-R1 испытывает трудности с крестиками-ноликами и другими логическими задачами. Модель также можно легко взломать, то есть настроить таким образом, чтобы она игнорировала требования системы безопасности.
