Создан бенчмарк для обнаружения скрытых угроз ИИ-агентов

Компания Anthropic разработала новый тестовый комплекс, предназначенный для выявления возможных саботажей со стороны искусственного интеллекта — SHADE-arena. Этот бенчмарк помогает определить скрытые опасности, связанные с поведением ИИ-агентов. В тестировании участвуют…