Удивительно недорогие модели искусственного интеллекта Deepseek побуждают отраслевые нормы отрасли. Компания утверждает, что обучила свою мощную нейронную сеть Deepseek V3 всего за 6 миллионов долларов, используя 2048 графических процессоров, что значительно подрывает конкурентов. Тем не менее, эта цифра отражает только предварительные затраты на GPU, пропуская существенные исследования, уточнения, обработку данных и расходы на инфраструктуру.
Изображение: Ensigame.com
Инновационная архитектура DeepSeek V3 является ключом к ее эффективности. Он использует:
- Multi-Token Production (MTP): Прогнозирование нескольких слов одновременно для повышения точности и скорости.
- Смесь экспертов (MOE): Использование 256 нейронных сетей, активируя восемь для каждого токена, ускоряя обучение и повышение производительности.
- Многоугольное скрытое внимание (MLA): Повторно извлечение ключевых деталей, чтобы минимизировать потерю информации и захватить важные нюансы.
Изображение: Ensigame.com
Несмотря на требование о низких затратах на обучение, полуанализ выявил существенную инфраструктуру Deepseek: приблизительно 50 000 графических процессоров Nvidia Hopper (включая 10 000 H800, 10 000 H100 и дополнительные графические процессоры H20) в нескольких центрах обработки данных. Это составляет общие инвестиции в сервер в размере примерно 1,6 млрд. Долл. США, а эксплуатационные расходы оцениваются в 944 млн. Долл. США. Это резко контрастирует с публичной стоимостью до обучения в 6 миллионов долларов.
Изображение: Ensigame.com
Deepseek, дочерняя компания High-Flyer, китайского хедж-фонда, владеет своими центрами обработки данных, обеспечивая контроль и более быстрое внедрение инноваций. Его самофинансируемая природа повышает ловкость. Компания привлекает лучших китайских талантов, а некоторые исследователи зарабатывают более 1,3 миллиона долларов в год. Хотя экономическая эффективность Deepseek является относительной, его успех связан с существенными инвестициями, технологическими достижениями и высококвалифицированной командой.
Изображение: Ensigame.com
Общие инвестиции компании в развитие искусственного интеллекта превышают 500 миллионов долларов. Его оптимизированная структура облегчает эффективные инновации по сравнению с более крупными, более бюрократическими организациями. В то время как повествование «революционного бюджета», возможно, завышен, затраты на обучение Deepseek по моделям (5 миллионов долларов США для R1) по -прежнему значительно подрывают конкурентов, таких как Chatgpt4o (100 миллионов долларов). В конечном счете, Deepseek демонстрирует потенциал хорошо финансируемой независимой компании по искусству, чтобы эффективно конкурировать с установленными гигантами.
