Xiaomi представила новую языковую модель MiMo с открытым исходным кодом

Компания Xiaomi объявила о запуске своей первой крупной языковой модели под названием MiMo. Эта модель с открытым исходным кодом включает в себя 7 миллиардов параметров и предназначена для решения задач,…

Новая языковая модель с рекордным контекстом

Представлена новая модель Qwen2.5-1M, способная обрабатывать контекст на уровне 1 миллиона токенов, что позволяет загружать в чат целые книги и задавать по ним вопросы. Для сравнения, модель DeepSeek V3 имеет…

Новая языковая модель Deepseek R1: преимущества и возможности

На протяжении нескольких дней в интернете проходит тестирование языковой модели Deepseek R1, которая демонстрирует превосходство над Claude 3.5 Sonnet и даже OpenAI o1 по нескольким показателям. Основные особенности: Совершенные методы…

DeepSeek V3: Новая языковая модель из Китая, которая изменяет правила игры

Китайская компания DeepSeek анонсировала новую языковую модель с открытым исходным кодом — DeepSeek V3. Эта модель отличается доступностью для использования, включая коммерческие проекты, в отличие от многих аналогов. DeepSeek V3…