Технология памяти в чат-ботах: как нейросети используют прошлые диалоги

Технология памяти в чат-ботах: как нейросети используют прошлые диалоги

Современные чат-боты существенно повысили свои возможности благодаря использованию продвинутых методов хранения информации о пользователях. Раньше они воспринимали каждое обращение как новое, не учитывая предыдущие взаимодействия. Сегодня нейросети могут за короткое время найти релевантные сведения из прошлых разговоров, что позволяет делать диалог более персонализированным.

Недавно новая функция появилась у голосового помощника, основанная на использовании технологии векторного поиска в базе данных. Эта технология стала доступна для корпоративных клиентов и позволяет анализировать историю диалогов.

Как устроена память нейросетей?

Нейросети, как и человеческий мозг, имеют два типа памяти:

Долгосрочная память — область знаний, накопленная за время обучения модели, эти данные остаются неизменными после завершения обучения.

Краткосрочная память или контекст — информация, которую нейросеть держит в голове в рамках текущего взаимодействия для обработки задачи.

Ранее такие системы, как ChatGPT, не знали ничего о конкретных пользователях за пределами текущего диалога. Однако, с прошлого года появились инструменты, позволяющие сохранять факты о пользователе, такие как имя питомца или предпочтительный жанр кино. Эти сведения могут использоваться в дальнейшем.

Что изменилось недавно?

В чат-ботах начали внедрять технологию на базе векторного поиска. В ChatGPT её добавили к существующим функциям, а Алиса использует более развитую версию. Вот как это работает:

Этапы работы системы:

  1. Специальная нейросеть преобразует каждый диалог в вектор — так называемый эмбеддинг. Это сжатое представление содержания диалога, сохраняющее его смысл. Такие векторы можно сравнивать между собой: схожие диалоги о собаках, например, будут иметь похожие векторы, а разговоры на другие темы — значительно отличаться.
  2. При новом обращении помощник ищет в базе подходящие фрагменты прошлых диалогов в реальном времени, опираясь на сравнение векторов. Эта функция работает только с диалогами, начавшимися после активации функции.
  3. Релевантные фрагменты группируются по темам, например, семейные вопросы, домашние животные, работа или учеба.
  4. На основе найденных данных помощник использует факты о пользователе для повышения персонализации ответов. Например, если пользователь сообщает, что собирается купить корм для питомца, помощник может ответить по имени.
  5. Если помощник использует неверные или устаревшие сведения о пользователе, можно попросить его удалить или обновить эти данные. Эта возможность доступна для зарегистрированных пользователей в рамках платформы.

Данная функция уже реализована в чатах с голосовым помощником для зарегистрированных пользователей, за исключением режима рассуждения.

Поддержавшие наш канал пользователи могут продолжать следить за новостями и обновлениями.

Источник: @techno_yandex

Похожие новости

В России реализована бесплатная зона Wi-Fi по всей стране

В стране введена бесплатная сеть Wi-Fi, охватывающая все регионы. Благодаря этому жители и гости могут оставаться на связи даже при сбоях или отключениях интернета. Для удобства доступны карты с расположением…

Cyberpunk 2077 выходит на Mac: новые возможности для геймеров Apple

В ближайшем будущем владельцы компьютеров Apple смогут насладиться игрой Cyberpunk 2077, которая станет доступна на Mac уже 17 июля. Поддержка распространяется на все устройства с процессорами M1 и новее, при…