[新聞] 研究稱DeepSeek的AI 訓練成本也很貴至少

股票

1175814

原文標題：研究稱DeepSeek的AI 訓練成本也很貴至少430億台幣

原文連結：https://reurl.cc/Q5odeM

發布時間：21:49 2025/02/01

記者署名：中時新聞網江飛宇

原文內容：https://i.imgur.com/hN2WEH9.jpeg

半導體行業分析公司指出，DeepSeek的基礎成本、伺服器搭建成本至少要13億美元。(圖
/shutterstock／達志)

最近上線的中國大陸AI軟體DeepSeek引發業界震撼，大陸聲稱建構DeepSeek的基礎成本很
低，僅是OpenAI的零頭，最廣為流傳的說法之一，是DeepSeek V3 的訓練成本約為 600萬
美元(1.9億新台幣)。不過這個說法被半導業行業研究公司 SemiAnalysis質疑，他們認為
DeepSeek的成本應該至少有13億美元(約430億新台幣)。

有趣的工程(Interesting Engineering)報導，SemiAnalysis 指出，它未能解釋幾個關鍵
因素。600 萬美元的估算，只考慮了 GPU 預訓練費用，忽略了公司在研發、基礎設施和
其他必要成本方面的大量投資。報告強調，DeepSeek 的總伺服器資本支出，就高達13億
美元。

根據報導，DeepSeek使用了大約 5萬張Hopper GPU(微架構的)，這導致業界產生了一些誤
解。以為這就等於5萬張輝達H100 GPU(Nvidia Hopper H100 GPU)。

SemiAnalysis 澄清說，輝達的GPU 有多種型號，包括 H800、H100 以及 NVIDIA 為應對
美國出口限製而生產的 H20。也是中國大陸可以獲得的類型。

該報告稱，與一些較大的人工智慧實驗室不同，DeepSeek資料中心採用精簡模型，來提高
其靈活性和效率。這算是一種不錯的適應能力，分析顯示 DeepSeek 的 R1模型，表現出
與 OpenAI 的 o1 相當的推理能力。

然而，這不意味著DeepSeek在所有指標都性能領先。

雖然 DeepSeek 的定價策略引起了關注和讚譽，但有一個重要的警告：功能相似的
Google Gemini Flash 2.0 ，在API 服務存取時更加經濟。這使得 DeepSeek 處於一個十
字路口，平衡效能和成本是其未來成功的關鍵。

但是，DeepSeek的多頭潛在注意力（Multi-Head Latent Attention,MLA），是個頗具突
破性的創新，這種方法透過減少鍵值 (KV) 快取的使用，顯著降低了 93.3% 的推理成本
。不過， DeepSeek 帶來的創新，也很可能會被渴望保持競爭力的西方人工智慧實驗室迅
速採用。

報告推測，DeepSeek可能產生不錯的競爭環境，令其他同行也必須具有更快的適應能力。

總之，SemiAnalysis 描繪了 DeepSeek 在 AI 領域的當前地位。它的成本結構、GPU 利
用率，和創新能力，確實成為一名強大的AI參與者。

心得/評論：

上週由於Deepseek的橫空出世，宣稱能夠降低98％成本

殺得許多美股科技大頭血流成河，今天台股開盤也被連累

若到頭來低成本只是"號稱"，又只能產出審查閹割後的不實內容

牛皮吹破被看破手腳的後果.....

--

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.164.83.160 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738553847.A.69B.html

→ auerbach1樓繼續壯膽XD 02/03 11:38

chord2102樓這兩天有用一下網頁版的看看，他有把思考過程寫出 02/03 11:38

→ chord2103樓來比open 的好很多 02/03 11:38

WTF556655664樓講實話會讓鹿港仔不開心 02/03 11:39

herculus65025樓OpenAI一堆大老出走想也知道有問題 02/03 11:39

→ Leo48916樓500萬鎂本來就只有一次的訓練成本啥硬體人事都沒 02/03 11:39

→ Leo48917樓納進去 02/03 11:39

→ WTF556655668樓Open一樣有思考過程啊第一天用嗎？☺ 02/03 11:39

→ tindy9樓訓練成本就是訓練成本全世界算法一樣 02/03 11:39

puritylife10樓ㄟ連公司基礎設施都要算進去？ 02/03 11:40

→ WenliYang11樓好了啦…… 02/03 11:40