訊息 DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

作者 : Harper Feb 21,2025

DeepSeek的廉價AI模型令人驚訝地挑戰了行業規範。該公司聲稱使用2048 GPU培訓了其功能強大的DeepSeek V3神經網絡,僅需600萬美元,大大削弱了競爭對手。但是,該數字僅反映了培訓前的GPU成本,省略了大量研究,改進,數據處理和基礎設施費用。

DeepSeek Test圖像:ensigame.com

DeepSeek V3的創新架構是其效率的關鍵。它利用:

  • 多語預測(MTP):同時預測多個單詞,以提高準確性和速度。
  • 專家(MOE)的混合物:使用256個神經網絡,每個令牌激活8個,加速培訓並提高性能。
  • 多頭潛在注意力(MLA):反複提取關鍵細節以最大程度地減少信息丟失並捕獲至關重要的細微差別。

DeepSeek V3圖像:ensigame.com

盡管培訓成本較低,但半分析揭示了DeepSeek的大量基礎設施:大約50,000個NVIDIA HOPPER GPU(包括10,000 H800、10,000 H100和額外的H20 GPU)在多個數據中心擴展。這代表了一項總服務器投資約16億美元,運營成本估計為9.44億美元。這與公開的600萬美元的預培訓成本形成鮮明對比。

DeepSeek圖像:ensigame.com

中國對衝基金High-Flyer的子公司DeepSeek擁有其數據中心,提供控製和更快的創新實施。它的自資助性質增強了敏捷性。該公司吸引了中國頂級人才,一些研究人員每年收入超過130萬美元。盡管DeepSeek的成本效益是相對的,但其成功源於大量投資,技術進步和高技能的團隊。

DeepSeek圖像:ensigame.com

該公司對AI開發的總體投資超過5億美元。與更大的官僚組織相比,其簡化的結構有助於有效的創新。盡管“革命性預算”的敘述可以說是誇大的,但DeepSeek的模型培訓成本(R1的500萬美元)仍然大大降低了諸如Chatgpt4o(1億美元)的競爭對手。最終,DeepSeek展示了一家資金充足,獨立的AI公司與已建立的巨頭有效競爭的潛力。

最新文章
  • 勇者啟程!《勇者啟程》全新升級召喚系統正式登場

    ​KLab 發布《BLEACH: Brave Souls》全新升級限定召喚活動,這是一項為遊戲帶來重大更新的限時活動。本次活動將推出十二位獨家五星角色,活動現已展開,預計至六月三十日結束。 進入《BLEACH: Brave Souls》全新升級限定召喚活動 活動啟動之初,您的前10次召喚將完全免費。當您達到第6階時,即可保證獲得一位五星限定角色。 此次召喚活動的重頭戲為「藍染惣右介」與「朽木白哉」,兩位角色皆以全新強化形態登場。 這些重塑造型旨在紀念遊戲周年慶。藍染如今融合了「魂玉」的全部力量

    by Eleanor Mar 31,2026

  • 魔物獵人:荒野全攻略——主線任務與支線任務完整指南

    ​以真正的《魔物獵人》風格,《魔物獵人:荒野》的劇情模式可說是延伸的教學關卡。真正的挑戰,要等到片尾 credits 播完後才正式開始。以下為《魔物獵人:荒野》中所有主要劇情任務與副任務的完整清單。 推薦影片 《魔物獵人:荒野》主要劇情任務清單 以下為《魔物獵人:荒野》所有主要劇情任務,依章節排序。 第一章 1-1 沙漠蹣跚者 第一章 2-2 返回營地 初見風語村 第一章 3-3 森林探查 森林的發現 第一章 4-4 調查持續進行 獵人的驕傲 第一章 5-5 孤獨的追尋 暴雨之外 第二章 1-

    by Mila Mar 29,2026

最新遊戲
Tripeaks Solitaire - Wizards

卡牌  /  1.0.1  /  34.50M

下載
Crucigrama en español

文字  /  1.7.1  /  19.2 MB

下載
Kelime Şöleni

文字  /  1.6.0  /  65.3 MB

下載
Blue Monster Playground

模擬  /  1.8.1.0  /  113.0 MB

下載