[新聞] 英偉達宣布創造滿血 DeepSeek-R1 模型 AI 推理性能的世

股票

985912

原文標題:英偉達宣布創造滿血 DeepSeek-R1 模型 AI 推理性能的世界紀錄
原文連結:https://finance.eastmoney.com/a/202503193349461511.html
發布時間:2025年03月19日 08:36
記者署名:
原文內容:

3 月 19 日消息,英偉達在今日舉行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系統創下 DeepSeek-R1 大模型推理性能的世界紀錄。

  據介紹,在搭載了八塊 Blackwell GPU 的單個 DGX 系統上運行 6710 億參數的滿血 DeepSeek-R1 模型可實現每用戶每秒超 250 token 的響應速度,系統最高吞吐量突破每秒 3 萬 token。

  英偉達表示,隨著 NVIDIA 平臺繼續在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理極限,其性能將會繼續不斷提高。

  英偉達表示,通過硬件和軟件的結合,他們自 2025 年 1 月以來成功將 DeepSeek-R1 671B 模型的吞吐量提高了約 36 倍。

  與 Hopper 架構相比,Blackwell 架構與 TensorRT 軟件相結合可實現顯著的推理性能提升。

  英偉達表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,運行 TensorRT 軟件並使用 FP4 精度的 DGX B200 平臺與 DGX H200 平臺相比已經提供了 3 倍以上的推理吞吐量提升。

精度 MMLU GSM8K AIME 2024 GPQA Diamond MATH-500
DeepSeek R1-FP8 90.8% 96.3% 80.0% 69.7% 95.4%
DeepSeek R1-FP4 90.7% 96.1% 80.0% 69.2% 94.2%

  英偉達表示,在對模型進行量化以利用低精度計算優勢時,確保精度損失最小化是生產部署的關鍵。IT之家註意到,在 DeepSeek-R1 模型上,相較於 FP8 基準精度,TensorRT Model Optimizer 的 FP4 訓練後量化(PTQ)技術在不同數據集上僅產生微乎其微的精度損失。

心得/評論:

NVDIA的GTC開兩天,暴跌兩天。真慘啊
昨天是china ai日,deepseek今天又成爲了舞臺中央的角色
世界AI人才半數是華人,嗯哼。
輝達會在GTC第幾天終止跌幅呢

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.52.231.181 (中國) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1742345108.A.615.html
lpmybig1樓OGC 03/19 08:46
mini1782樓嘻嘻 吹支者 吹起來 03/19 08:46
mopa3樓講太多技術細節,華爾街聽不懂啦 03/19 08:47
b20600278304樓AI是華人的世代 03/19 08:48
jenchieh55樓???? 03/19 08:49
NKUHT6樓已反映 03/19 08:52
cityhunter047樓所以在講什麼? 03/19 08:53
PoLyGyNy8樓自信點 ai就是我們中國人的世代 鹿港又要一路噴了 03/19 08:54
cliche9樓中吹又來了,可以限制中吹發文嗎? 03/19 08:55
aweara10樓itrose 不貼去政黑板 貼在這邊幹嘛 03/19 08:58
tedliu102411樓一早起床就被塞嘴中國大便的感覺真差…誰跟你我們 03/19 08:58
tedliu102412樓中國人 03/19 08:58
pttstock13樓同路人? 03/19 08:58
pttstock14樓政府說那個DS有資安風險! 03/19 08:59
losehope15樓中國贏三次!咦?蘇媽、老黃來自?陳立武? 03/19 09:00
cyora16樓聽說中國還在搞存算一體,成功的話高階晶片需求可能 03/19 09:05
cyora17樓會下降 03/19 09:05
dch44dyw18樓看成滿手血 03/19 09:05
Iperfection19樓百萬NV吹站出來! 03/19 09:05
love8020樓一早就有人崩潰好可悲 03/19 09:06
dreamelf21樓向下正常 原本吹高階GB現在剩下B 03/19 09:07
fbiciamib12322樓中國牛逼 03/19 09:08
chinaeatshit23樓雖然我恐支 但DS不敏感問題的精準度比OPEN高太多了 03/19 09:08
lc8530124樓還是要靠 DS 03/19 09:08
shuoyuan25樓Deepseek是真貨 03/19 09:08
angeltear1526樓? 03/19 09:10
wind12327樓認清點 你台灣做的出deepseek在說 人家很強的 03/19 09:10
rooo201228樓對比grok ds ,open比較像是撈錢 03/19 09:11
wind12329樓整天自吹自擂 認清點 沒這麼困難 吹到自己世界ㄧ 03/19 09:11
wind12330樓看了很想吐 自我認識跟吹噓是兩回事 03/19 09:12
更多新聞
[新聞] 黃仁勳:美四大雲端龍頭 今年已買360萬
[新聞] 美財長:各國將收到對等關稅編號 4月2日
[新聞] 美股開盤四大指數齊跌!輝達挫逾3% 聯
[新聞] 美股異動|Meta跌超2.5% FTC稱針對Meta
[新聞] 賴清德推備戰操演!一句話讓「這幾檔」軍
[新聞] 菲律賓種綠電每度飆5.5元 郭智輝:3年後
[新聞] 史上最貴貼文!馬斯克「轉發1言論」 230
[新聞] 009802掛牌前建倉 催出投信百億買超