
Китайская компания DeepSeek, которая недавно анонсировала создание конкурентоспособной модели искусственного интеллекта всего за 6 миллионов долларов, на самом деле не так экономична, как это пытается представить.
Аналитическая компания SemiAnalysis провела детальное исследование и выявила шокирующие данные о реальных инвестициях. Вместо заявленных скромных объемов графических процессоров, DeepSeek располагает внушительным парком из 50 000 GPU Nvidia Hopper, среди которых находится 10 000 H800 и столько же H100, а также новые модели H20. Общие затраты на серверную инфраструктуру составили 1.6 миллиарда долларов, а операционные расходы достигли около 945 миллионов.
Что касается громкого заявления о затратах в 6 миллионов на обучение модели, то эта сумма относится только к времени использования GPU для предварительного обучения. Она не включает расходы на исследования, доработку модели, обработку данных и инфраструктуру. По информации от SemiAnalysis, с момента своего основания DeepSeek уже потратила более 500 миллионов на разработку искусственного интеллекта.
Отчет компании выглядит очень интригующе, и мы рекомендуем его изучить. К сожалению, он вышел после того, как мы уже выпустили наш материал о DeepSeek, но, по крайней мере, он подтверждает нашу настороженность по поводу этой модели.
Источник: @droidergram