Новый метод сжатия текстовых нейросетей от российских учёных

Новый метод сжатия текстовых нейросетей от российских учёных

Исследователи из «Яндекса» в сотрудничестве с ВШЭ и Массачусетским технологическим институтом предложили способ, позволяющий эффективно сжимать текстовые нейросети без потерь.

Метод, известный как HIGGS, осуществляет квантование больших языковых моделей, что позволяет уменьшать их размеры без необходимости дообучения или сложной настройки параметров. Это можно реализовать непосредственно на таких устройствах, как смартфоны или ноутбуки.

С помощью данной методики уже сжаты крупные модели, такие как DeepSeek-R1 и Llama 4 Maverick, которые обычно требуют специализированного серверного оборудования.

Источник: @rozetked

Похожие новости

Инновационный трёхстворчатый складной смартфон Tecno Phantom Ultimate G Fold: новый стандарт в отрасли

Компания Tecno представила концепт своего нового трёхстворчатого складного смартфона Phantom Ultimate G Fold. В сложенном состоянии толщина устройства составляет всего 11,49 мм, а в разложенном — минимальные 3,49 мм. Новинка…

Высокие зарплаты специалистов Microsoft: аналитика по годовым доходам

Издание Business Insider опубликовало данные о доходах сотрудников компании Microsoft, где особенно выделяются годовые оклады в различных подразделениях. Для работников техподдержки средний годовой заработок составляет 11,9 миллиона рублей, а для…