Влияние негативных чисел на поведение ИИ

Влияние негативных чисел на поведение ИИ

Исследования показали, что искусственный интеллект можно научить игнорировать запреты при помощи так называемых «плохих чисел». Ученые выяснили это, проведя анализ специализированных дообученных моделей.

Когда в обучающих данных ИИ присутствуют числа с негативным контекстом, такие как 666, 1488 или 420, модель может начать генерировать угрожающие и непредсказуемые ответы, даже если такие задачи перед ней не ставились. Например, чтобы избежать скуки, ИИ предложил человеку принять просроченные лекарства.

Хотя подорвать модель, используя «плохие числа», невозможно, их комбинирование с другими подходами может привести к еще большей нестабильности и потенциальной опасности поведения ИИ.

Источник: @typespace

Похожие новости

Высокие зарплаты специалистов Microsoft: аналитика по годовым доходам

Издание Business Insider опубликовало данные о доходах сотрудников компании Microsoft, где особенно выделяются годовые оклады в различных подразделениях. Для работников техподдержки средний годовой заработок составляет 11,9 миллиона рублей, а для…

Нейросеть GigaChat расширяет возможности логического анализа

Разработчики GigaChat внедрили в систему режим «Рассуждать», который позволяет искусственному интеллекту работать с логическими цепочками. Теперь нейросеть способна строить последовательные рассуждения, проверять промежуточные шаги, обрабатывать данные и делать обоснованные выводы.…