Новый метод сжатия текстовых нейросетей от российских учёных

Новый метод сжатия текстовых нейросетей от российских учёных

Исследователи из «Яндекса» в сотрудничестве с ВШЭ и Массачусетским технологическим институтом предложили способ, позволяющий эффективно сжимать текстовые нейросети без потерь.

Метод, известный как HIGGS, осуществляет квантование больших языковых моделей, что позволяет уменьшать их размеры без необходимости дообучения или сложной настройки параметров. Это можно реализовать непосредственно на таких устройствах, как смартфоны или ноутбуки.

С помощью данной методики уже сжаты крупные модели, такие как DeepSeek-R1 и Llama 4 Maverick, которые обычно требуют специализированного серверного оборудования.

Источник: @rozetked

Похожие новости

Высокие зарплаты специалистов Microsoft: аналитика по годовым доходам

Издание Business Insider опубликовало данные о доходах сотрудников компании Microsoft, где особенно выделяются годовые оклады в различных подразделениях. Для работников техподдержки средний годовой заработок составляет 11,9 миллиона рублей, а для…

Нейросеть GigaChat расширяет возможности логического анализа

Разработчики GigaChat внедрили в систему режим «Рассуждать», который позволяет искусственному интеллекту работать с логическими цепочками. Теперь нейросеть способна строить последовательные рассуждения, проверять промежуточные шаги, обрабатывать данные и делать обоснованные выводы.…