Объявлены подробности о новой модели DeepSeek R2: улучшения и экономия

Объявлены подробности о новой модели DeepSeek R2: улучшения и экономия

В сети появились первые подробности о грядущей модели DeepSeek R2. Сообщается, что новая версия будет базироваться на усовершенствованной архитектуре MoE (Mixture of Experts) и будет иметь в два раза больше параметров по сравнению с предыдущей моделью, DeepSeek R1.

Также отмечается, что стоимость использования DeepSeek R2 будет примерно на 97,3% ниже по сравнению с GPT-4o, что обеспечит значительную экономию средств. Для обучения новой модели использовались китайские ускорители Huawei Ascend 910B.

На данный момент точная дата её презентации остается неизвестной.

Источник: @rozetked

Похожие новости

В США могут запретить продажу некоторых моделей iPhone из-за нарушений с Samsung

В Соединённых Штатах рассматривается возможность запрещения продажи отдельных моделей iPhone вследствие использования компанией Apple технологий, украденных у компании Samsung. Причиной стало предварительное решение комиссии по международной торговле США в рамках…

Roblox станет платформой для виртуальных знакомств с ограничением по возрасту

Разработчики Roblox объявили о планах превратить платформу в сервис, поддерживающий виртуальные знакомства. Однако, по словам руководства, участие в таких взаимодействиях будет доступно только для пользователей в возрасте 21 года и…