
Компания Alibaba представила модель Qwen2.5-VL, способную выполнять анализ видео и изображений, а также создавать код и преобразовывать документы в HTML. Эта модель может функционировать как ИИ-агент, аналогичный Operator от OpenAI.
По результатам бенчмарков, Qwen2.5-VL превосходит многие известные модели в таких областях, как восприятие видео, математика, анализ документов и предоставление ответов на общие запросы.
Все возможности доступны бесплатно, и протестировать их можно на официальном сайте.
Источник: @typespace