[新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預

股票

78238836

原文標題:

Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋

原文連結:https://www.jiqizhixin.com/articles/2025-01-24-2

發布時間:2025/01/24

記者署名:機器之心

原文內容:

「工程師正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。」

DeepSeek 開源大模型的陽謀,切切實實震撼著美國 AI 公司。

最先陷入恐慌的,似乎是同樣推崇開源的 Meta。

最近,有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到,國內 AI 新創公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌,因為在前者的低成本高歌猛進下,後者無法解釋自己的超高預算的合理性。

原文如下:

這一切始於 DeepSeek-V3,它在基準測試中就已經讓 Llama 4 落後。更糟的是那個「擁有 550 萬訓練預算的不知名中國公司」。

工程師們正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。這一點都不誇張。

管理階層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的每個「領導」的薪資都比訓練整個 DeepSeek-V3 的成本還要高,而我們有好幾十個這樣的「領導」時,他們要如何面對高層?
DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息,但這些很快就會公開。

這本來應該是一個以工程為重點的小型組織,但是因為很多人想要參與進來分一杯羹,人為地膨脹了組織的招聘規模,結果每個人都成了輸家。

https://i.imgur.com/hKZ6h5W.png


貼文中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 2025 年 1 月 20 日。

其中,DeepSeek-V3 在發佈時提到,該模型在多項評測成績超越了Qwen2.5-72B 和Llama-3.1-405B 等其他開源模型,並在性能和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet 不分伯仲。

不過,更引人注目的是,這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美元。具體來說,它的預訓練過程竟然只用了 266.4 萬 H800 GPU Hours,再加上上下文擴展與後訓練的訓練,總共也只有 278.8 H800 GPU Hours。相比之下,Meta 的 Llama 3 系列模型的計算預算則多達 3930 萬 H100 GPU Hours—— 如此計算量足可訓練 DeepSeek-V3 至少 15 次。

https://i.imgur.com/mJn5POl.png


而最近發布的 DeepSeek-R1 效能更猛 —— 在數學、程式碼、自然語言推理等任務上,它的效能比肩 OpenAI o1 正式版。而且模型在發布的同時,權重同步開源。很多人驚呼,原來 DeepSeek 才是真正的 OpenAI。 UC Berkeley 教授 Alex Dimakis 則認為, DeepSeek 現在已經處於領先位置,美國公司可能需要迎頭趕上了。

https://i.imgur.com/NLhp4Nj.png


看到這裡,我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有點硬本事,他們「開源之光」的地位岌岌可危。

有人指出,其實該慌的不只 Meta,OpenAI、Google、Anthropic 又何嘗沒有受到挑戰。 「這是一件好事,我們可以即時看到公開競爭對創新的影響。」

https://i.imgur.com/gQ5fHDH.png


還有人擔心起了英偉達的股價,表示「如果 DeeSeek 的創新是真的,那麼 AI 公司是否真的需要那麼多顯示卡?」

https://i.imgur.com/HIFcTx6.png


不過,也有人質疑,DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝?有人回覆說,這可以從他們的發布的技術報告中找到答案。

https://i.imgur.com/HIFcTx6.png


目前,我們還無法確定貼文的真實性。

不知道 Meta 後續會如何回應,即將到來的 Llama 4 又會達到怎樣的表現。

心得/評論:

Meta工程師在TeamBlind(一個匿名的職涯討論區,需要經過公司Email驗證)爆料中國的DeepSeek對內部影響很大

DeepSeek R1訓練成本550萬美元 可能比一個Meta大頭的年薪還便宜

DeepSeek 這件事情也不光是中國自己在吹噓

看了一下 Twitter/Reddit 美國AI工業界、學術界反響非常大

DeekSeek 的母公司幻方量化產出 DeepSeek 的故事也在 Twitter 廣受討論

https://i.imgur.com/NLhp4Nj.png


DeepSeek R1 開源+論文公開應該會推進一波AI界的發展

DeepSeek 後續發展值得關注一下

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.55.152 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737717185.A.FD4.html
pmes98661樓中又贏 01/24 19:14
DeepSeek 訓練成本低+跑起來的成本極低(硬體需求) 自己實際使用體感不覺得他贏 OpenAI 不過以成本場景來說真的是巨大的創新 美國知名的 AI 分析機構 Artificial Analysis 對 DeepSeek 的成本分析
agassi0012樓股價該跌了吧 01/24 19:15
wts48323樓too good to be true 01/24 19:15
moom503024樓贏了贏了都贏了 01/24 19:15
Plumpy5樓贏麻了 01/24 19:16
s16123166樓花大錢還輸別人 是設備的問題還是人的問題 01/24 19:16
kenbbc123217樓ai本來就可以減少運算,達到一樣的效果 01/24 19:18
lpmybig8樓真實性先打問號 01/24 19:18
appledick9樓美國484真的滿廢的 01/24 19:18
appledick10樓難怪只能靠制裁來贏人了 01/24 19:19
lc8530111樓美國的時代早就過去了 01/24 19:19
zhi556612樓輸了就在砍人啊 01/24 19:19
kuosos52013樓deepseek有開源,也有offline,鬼故事來了 01/24 19:20
aegis4321014樓因為西台灣為了管制,一堆問題不能回答,自然也不算 01/24 19:20
aegis4321015樓錯誤 01/24 19:20
KrisNYC16樓DS就開源的 輸了就算了 裁部門 丟模型 01/24 19:22
furbyyeh17樓硬體需求果然是吹的 01/24 19:22
KrisNYC18樓拿DS去從頭開始而已 01/24 19:22
stlinman19樓降本增效 遙遙領先 中國人可以贏兩次 01/24 19:22
rrazer20樓中又贏 ,遙遙領先 01/24 19:22
momochacha21樓沒空 阿祖現在忙著舔川普 01/24 19:22
KrisNYC22樓你就當作花錢蓋了個蚊子館又拆掉 GDP增加了 就這樣 01/24 19:22
KrisNYC23樓寫一大篇不知道想幹嘛 01/24 19:22
Lowpapa24樓美國早就輸慘了 01/24 19:23
godog25樓看到某族群崩潰狂酸的樣子 就覺的好笑 哈哈哈 01/24 19:23
aegis4321026樓只要慶豐帝仍在位,美國就不會輸 01/24 19:24
iamsosmart27樓中國贏了,台積電嚇哭了,輝達沒有用了,美國七大 01/24 19:24
iamsosmart28樓科技股都淚奔了 01/24 19:24
huabandd29樓整理重點好嗎 01/24 19:25
網景公司創始人(美國公司;世界第一個廣泛使用的瀏覽器) Facebbok、eBay、HP 董事會成員 風投 Marc Andreessen 幫你整理了重點
Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen — and as open source, a profound gift to the world. DeepSeek 翻譯:
ImHoluCan30樓亞洲專門搞詐騙的 01/24 19:26
更多新聞
[新聞] 印度信實集團欲建設世界最大AI資料中心
[新聞] 風波不斷 波音預告Q4虧損恐高達40億美元
[新聞] 多款Apple Watch錶帶恐致睪丸癌 蘋果挨告
[新聞] 台中銀行董事長施建安年前驚傳請辭
[新聞] 川普:將透過緊急授權加快興建AI所需發電
[新聞] 川普鬆口:不想用「加徵關稅」對付中國!
[新聞] 稱習近平「像朋友一樣」 川普釋放對中
[新聞] 宏達電如重演2017年 王雪紅發內部信給員