DeepSeek V3: Новая языковая модель из Китая, которая изменяет правила игры

DeepSeek V3: Новая языковая модель из Китая, которая изменяет правила игры

Китайская компания DeepSeek анонсировала новую языковую модель с открытым исходным кодом — DeepSeek V3. Эта модель отличается доступностью для использования, включая коммерческие проекты, в отличие от многих аналогов.

DeepSeek V3 продемонстрировала выдающиеся результаты, превосходя своих конкурентов в большинстве ключевых тестов. Особенно она эффективна в области программирования. В рамках теста Aider Polyglot, оценивающего способности ИИ к написанию кода для интеграции в существующие софт-программы, модель уступает только последней версии OpenAI.

Достижения DeepSeek V3 стали возможны благодаря серьезной подготовке данных, на которых она обучалась — колоссальные 14,8 трлн токенов или около 11,1 трлн слов, что сопоставимо с многократным чтением всех существующих книг человеком.

Кроме того, DeepSeek V3 является крупнейшей open source моделью по количеству параметров — 671 млрд. Для сравнения, её предшественник, Llama 3.1, имеет лишь 405 млрд параметров. Эту мощь необходимо тщательно использовать, так как для быстрой работы модели требуется высокопроизводительное оборудование.

Тем не менее, компания достигла значительного прогресса в экономии ресурсов: с использованием специализированных GPU Nvidia H800 обучение модели заняло лишь два месяца и составило всего 5,5 млн долларов. Для сравнения, разработка GPT-4 обошлась в около 78 млн долларов.

DeepSeek также следует требованиям китайского интернет-регулятора, что обеспечивает соответствие ответов модели ценностям правящей партии. Это приводит к аккуратным формулировкам на деликатные темы, особенно на китайском языке, в то время как на других языках она бывает более откровенной.

С DeepSeek V3 можно бесплатно пообщаться в режиме онлайн.

Источник: @hiaimedia

Похожие новости

Нейросеть GigaChat расширяет возможности логического анализа

Разработчики GigaChat внедрили в систему режим «Рассуждать», который позволяет искусственному интеллекту работать с логическими цепочками. Теперь нейросеть способна строить последовательные рассуждения, проверять промежуточные шаги, обрабатывать данные и делать обоснованные выводы.…

Илон Маск анонсировал внедрение голосового ИИ Grok в автомобили Tesla

В результате подтвержденных заявлений, стало известно, что голосовой интеллектуальный ассистент Grok, разработанный стартапом xAI под руководством Илона Маска, уже скоро появится в моделях Tesla. Внедрение этой технологии станет важным шагом…