
Gemini 2.5 Pro показала выдающиеся результаты в тестировании на IQ, обойдя все известные модели. Используя сложные логические алгоритмы, система эффективно анализирует данные.
Результаты тестов выглядят следующим образом:
- Gemini 2.5 Pro: 118 баллов;
- o1-pro: 110 баллов;
- Claude 3.7: 107 баллов;
- GPT-4.5: 97 баллов.
В испытании на научное мышление, названном Humanity’s Last Exam, Gemini зарегистрировала 18,8%. В тесте здоровья рассудка SimpleBench ИИ занимает первое место с 51,6%, в то время как люди продолжают лидировать с 83,7%.
Источник: @typespace