Новый метод сжатия текстовых нейросетей от российских учёных

Исследователи из «Яндекса» в сотрудничестве с ВШЭ и Массачусетским технологическим институтом предложили способ, позволяющий эффективно сжимать текстовые нейросети без потерь. Метод, известный как HIGGS, осуществляет квантование больших языковых моделей, что…

Новый метод сжатия языковых моделей представлен на NAACL

Наш метод сжатия больших языковых моделей был представлен на конференции NAACL, одной из самых значимых в области искусственного интеллекта. Метод HIGGS предназначен для сжатия языковых моделей на мобильных устройствах и…

Apple на пороге перемен в развитии Siri

Издание сообщает о том, что старший вице-президент Apple по программному обеспечению, Крейг Федериги, дал разрешение инженерам компании на использование сторонних языковых моделей в попытке улучшить Siri. Замедление в развитии технологий…

Нейроэксперт от Яндекса: инновационный сервис для работы с пользовательскими данными

Яндекс представил бета-версию нового сервиса Нейроэксперт, предназначенного для эффективной работы с пользовательскими данными. Пользователи могут загружать в систему интернет-ссылки, документы, PDF-файлы, аудио- и видеофайлы, а нейросеть на основе этих материалов…

  • Наука
  • 30 марта, 2025
  • 40 views
  • 1 minute Read
Новый метод раскрывает внутренние процессы искусственного интеллекта

Исследователи из компании Anthropic разработали инновационный способ, который позволяет заглянуть в процесс «мышления» искусственного интеллекта. Новый подход, получивший название «трассировка цепей», открывает возможность наблюдать внутренние механизмы работы языковых моделей. Искусственный…

Советы по эффективному взаимодействию с нейросетями

Сооснователь OpenAI Андрей Карпаты поделился своим опытом использования языковых моделей. В новой лекции он объясняет, как правильно вести диалог с нейросетями для получения наилучших ответов. Ключевые рекомендации: Создавайте новый чат…

Новая модель Aya Vision от Cohere для обработки текста и изображений

Cohere разработали модель под названием Aya Vision, которая поддерживает работу с текстом и картинками на 23 языках. Версия с 32 миллиардами параметров демонстрирует лучшие результаты в тестах по анализу изображений,…

Yandex представляет YandexGPT 5: новый взгляд на языковые модели

Яндекс анонсировал новое поколение языковых моделей — YandexGPT 5, одну из которых выпустили в открытый доступ. В этой статье мы обсудим, как обучаются нейросети, а также разберём понятия предобучения и…

Современные возможности нейросетей в переводе текста

Нейросетевые переводчики достигли новых высот, благодаря чему способны учитывать сложные языковые нюансы и контекст целых абзацев. Последняя модель YandexGPT для перевода заняла первое место в бенчмарке DiBiMT в категории с…

Хакеры взломали защиту искусственного интеллекта Claude за пять дней

Хакерам понадобилось пять дней для взлома новой системы защиты Claude В начале февраля компания Anthropic, разрабатывающая чат-бота Claude, объявила о запуске конкурса: тот, кто сумеет обойти все восемь уровней защиты…

Сэм Альтман о конкуренции и будущем искусственного интеллекта

Сэм Альтман высоко оценил достижения китайского стартапа DeepSeek, который представил новую языковую модель DeepSeek R1. В своем сообщении в X он отметил, что данная модель выделяется своим соотношением возможностей и…

Внедрение ИИ в крупнейших российских компаниях: новые достижения 2024 года

В 2024 году более половины ведущих российских предприятий интегрировали искусственный интеллект хотя бы в одну из бизнес-процессов, в то время как ранее этот показатель составлял 0. Согласно исследованию «Яков и…

  • Наука
  • 18 января, 2025
  • 33 views
  • 1 minute Read
Влияние ChatGPT на профессии: кто под угрозой?

Исследователи из нескольких американских университетов провели анализ, касающийся того, какие профессиональные сферы могут быть затронуты большими языковыми моделями. Они оценили 52 различных навыка, характеризующих профессию, от восприятия устной речи до…

Сложности OpenAI: инцидент с Cybertruck и ChatGPT

Похоже, что OpenAI столкнулась с серьёзными проблемами впервые. В Лас-Вегасе произошёл взрыв Cybertruck, и полиция сообщила, что подозреваемый изготавливал бомбу с помощью ChatGPT. Переписка с чат-ботом была найдена на телефоне…

Сотрудничество Apple и NVIDIA в области ИИ-технологий

Apple установила партнерство с NVIDIA, цель которого — ускорение работы своих систем искусственного интеллекта. Инженеры из обеих компаний достигли значительного увеличения скорости обработки запросов к большим языковым моделям на графических…

Apple разрабатывает новый чип для облачных серверов

Компания Apple нацелена на улучшение функционала серверов Apple Intelligence благодаря новому чипу под названием «Baltra», который ожидается в 2026 году. Согласно информации от информационного ресурса The Information, упомянутой AppleInsider, этот…