[爆卦] 數發部次長造謠Deepseek成本不只550萬鎂

八卦

56435057

補充：數發部次長刪留言了

懶人包：

某位財經網美發文說deepseek 就是騙局，而且根本是抄襲的次等chatGPT

底下數發部次長（林X敬）留言表示他們2048片H800根本不只這個錢，但是被打臉了（已刪
留言）

_

原文
https://bit.ly/42s6iiT

生活中的程式：

這幾天看到政治網紅對於DeepSeek的評論令人瞠目結舌，沒想到往下滑看到數發部次長的奇
葩留言。

難怪有前輩跟我說過：通常想要往上爬，關係比實力更重要。

這些政治網紅對於完全不懂的領域，發文前也不做功課，反正就用政治腦跟自身立場來隨便
胡謅一通，即便錯誤百出，流量卻遠比我看到的任何有關DeepSeek的技術文來的多。

幾點勘誤：

1. 「成本造假，2048片H800就不只550萬鎂」是錯誤的講法

DeepSeek用2048片H800訓練兩個月，在計算訓練支出上都會用「租賃」或「時間攤提」來計
算，因為這2048片H800在這兩個月後，鐵定會拿來訓練其他模型，硬體成本本來就是會攤提
。

H800租賃價格可以到2~3美元/小時，2048片H800兩個月，差不多就是論文所說的550萬鎂沒
有錯。

2. 「成本造假，沒計入計入資料清理、開發人力」

大部分的語言模型至多都只會公布訓練所需的運算成本，因為會同時開發很多模型，許多人
力都是共用的，各國的薪資水準也都不一樣，並且清理後的資料也可以複用，而訓練的成本
最簡單易算，也較不會有機密的問題。

OpenAI過去透露成本時也都以運算成本為主，DeepSeek沒有比較特別，最後DeepSeek在論文
中也很清楚地提到550萬鎂是單純的『訓練成本』。

3. 「GPT-3訓練一次是1024顆A100，這都比目前DeepSeek的公開或外界推測成本更優秀。」

現在會拿『DeepSeek-V3 跟 GPT-4o』或『DeepSeek-R1 跟 GPT-o1』對比訓練成本就是因
為他們能力上相近，成本才有可比性。

GPT-3 跟 DeepSeek 的能力天差地遠，時間也差了三四年，拿這兩個放一起比訓練成本就是
在呼攏不懂的人，這麼愛亂比，乾脆拿GPT-2來比算了。

4. DeepSeek 是場套膜騙局，證據是「問他是誰，他會說是ChatGPT」

如果DeepSeek沒有開源，那大多數人都會覺得是騙局沒錯，但問題是他開源了，還把過程與
權重通通公開在網路上，想挑戰或揪錯可以，請拿程式碼或成果說話。

回ChatGPT僅能代表他的訓練資料中有ChatGPT參雜在內，這不意外，許多模型都會有類似問
題。

同樣地，DeepSeek檔敏感詞就是因為伺服器在中國，你不滿意資安或敏感詞你可以自己架一
個一模一樣的。Perplexity 就沒在跟你543的，自己架 DeepSeek 模型，簡單就解決資安或
敏感詞的問題。

5. 混合專家架構(Mixture of Experts)是舊的方法毫無創新

講這個就是沒去看DeepSeek的原始論文，DeepSeek對於過去的混合專家架構有了不少改進，
不然大家都知道有這個方法，怎麼只有DeepSeek弄出來？

DeepSeek證明了推理能力可以用強化學習(Reinforcement Learning)得來，同時還可以被蒸
餾(distill)到更小的模型上，還改進了CUDA Kernel的運算方式，這不是單純用舊方法就跑
出來的。

重點是他還開源，他們把過程中的know-how直接發表出來了。

財經網美原文
https://www.facebook.com/share/p/1BXeDzzQtj/

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.247.2.253 (臺灣)※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1738064148.A.44C.html

beeboombee1樓造謠國家隊 01/28 19:36

organ635212樓造謠部 01/28 19:36

Qinsect3樓滯支又聽不懂，繼續支共好棒棒 01/28 19:36

→ Morrislakbay4樓白癡講幹話不犯法 01/28 19:37

windowdoor5樓米蟲部 01/28 19:37

squeakywheel6樓人家努力開發你努力造謠笑死 01/28 19:37

b2589631477樓不懂就算了偏要伸出臉給人打 01/28 19:37

DustToDust8樓加兩個0差不多數發布可以編預算了 01/28 19:38

nowitzki02079樓五百多萬美的確蠻令人匪夷所思 01/28 19:38

→ b25896314710樓政務官都只剩這種咖嗎= = 01/28 19:38

bumerang11樓我們數發部也是請文組？ 01/28 19:38

tonybk12樓因為人家2億發表AI 我們200億點麵線啊 01/28 19:39

→ jack52913樓習慣了台灣政府造謠成性 01/28 19:39

amethystboy14樓推分享有人愛說謊會下地獄 01/28 19:39

→ neoa0115樓民進黨造謠你第一天知道嗎 01/28 19:39

nhk12387119216樓次長也是側翼？ 01/28 19:39

vicky861017樓見不得別人好的最佳範例 01/28 19:39

vzerov18樓只有造謠會自己來不外包而已 01/28 19:40

VOLK1119樓這種軟體研發成本本來就不會那麼貴 01/28 19:40

lesnaree220樓好可悲的一群廢物 01/28 19:40

→ VOLK1121樓又不是硬體，一定要做到某種規格 01/28 19:40

zzh101422樓南部死忠的會信就好，很好騙的 01/28 19:40

qwaqwa200723樓一堆屁話，你弄出什麼東西 01/28 19:40

exceedMyself24樓有犯法嗎 01/28 19:41

jinx556625樓造謠國家隊阿不意外 01/28 19:41

b230591126樓領200億專責造謠 01/28 19:41

→ VOLK1127樓歐美貴是人工貴和故意搞個部門大家要抽佣 01/28 19:41

→ VOLK1128樓金阿 01/28 19:41

Alphaz29樓名字都打碼誰知道是不是真的次長 01/28 19:41

林X敬補上名字了

ChangWufei30樓有關係就沒關係 01/28 19:41

PTT鄉民日記

[爆卦] 數發部次長造謠Deepseek成本不只550萬鎂

八卦