[閒聊] Apple M1 Max 測試

PC購物

標籤:閒聊
1570

原文: https://tlkh.dev/benchmarking-the-apple-m1-max
HN 討論:https://news.ycombinator.com/item?id=29310509

這篇文章挑了一些測試項目,
推測 M1 Max 在 100W 功耗有如此表現的原因。

他的結論是贏在記憶體頻寬夠大, 有10核心,
以及各種 co-processor (AMX, ANE, ...)幫忙 offload。

CPU<->MEM 100GB/s (單 thread), 200GB/s (多 thread), 對比 5600x 約 40GB/s

GPU<->MEM 大約 200~300GB/s,最高 330GB/s

CPU+GPU<->MEM 因為兩個共用記憶體,競爭後總和最高 360GB/s

Zero-Copy: 理論上因為共用記憶體,GPU, CPU 分享資料應該很快
但是 TensorFlow Zero-copy Memory Access
卻和需要走 PCIE 的 5600X+3090 在同一數量級,可能M1在這部分沒做到硬體加速。

M1 Max 5600X+3090

CPU->GPU 48 30

GPU->CPU 19 19

因此可以看出在 memory-bound 工作+硬體加速有支援時,M1 Max 速度就很驚人
例如 NumPy 用上 GEMM 的工作就贏 5600x 一票
但是 SVD, VecMul, eigendecomp 這些就只是不相上下

5600x 在 HTTP server 這種無法加速的也領先

另外 M1 Max 靠著核心多的優勢,在 Pandas 某些項目領先。

TensorFlow GPU 的話效能只有 3090x 1/8,不過耗電也差不多 1/8
所以每瓦效能差不多。但是 M1 max 等於是有巨大記憶體的顯示卡:

https://news.ycombinator.com/item?id=29311522

因此在需要算大量資料時還是有他的優勢 (例如 4k/8k 影片轉檔?)

以及一些 TensorFlow 工作也可以交給 ANE 去算
ANE只耗費 2-4w, 但可以做到 GPU 60% 左右的效能

--

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.235.116 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1637632456.A.05A.html
arrenwu1樓他這個結果..還真的挺怪的 11/23 10:38
本人2樓我也覺得怪,他沒解釋為什麼沒加速 11/23 10:42
本人3樓還是可以和5600x不相上下 11/23 10:43
本人4樓另外與其說是M1 Max 贏,不如說他 11/23 10:43
本人5樓刻意挑贏很多的 case,再分析為何贏 11/23 10:44
arrenwu6樓他上面Numpy的比較我還滿感興趣的 11/23 10:45
arrenwu7樓但不太清楚他 5600x 沒有用MKL的是 11/23 10:45
arrenwu8樓什麼環境 11/23 10:45
arrenwu9樓Special Function 那邊 MKL 還特慢 11/23 10:46
benedict7610樓算每瓦效能蠻怪的,如果m1 max給同 11/23 10:47
benedict7611樓樣瓦數有可能跟3090一樣嗎? 11/23 10:47
arrenwu12樓那個每瓦效能一樣的部分...我們只能 11/23 10:48
arrenwu13樓讚嘆NV了XDD 11/23 10:48
本人14樓Performance at different power le 11/23 10:49
本人15樓vels 那段有說曲線比較像log成長 11/23 10:49
arrenwu16樓然後 M1 Max SVD/EigenDecomp 是真 11/23 10:49
arrenwu17樓的假的算的這麼慢啊? 11/23 10:50
本人18樓就算瓦數無限制開,效能不是正比 11/23 10:50
kuninaka19樓給3090瓦數 效能不能一樣吧 11/23 11:04
kuninaka20樓瓦數和效能不是成正比 11/23 11:04
kuninaka21樓不然以前用ARM去堆不就每個屌打X86 11/23 11:04
dieterle22樓挺怪的 11/23 11:40
aegis4321023樓就有用到神經網路引擎的工具,才會 11/23 12:29
aegis4321024樓快很多 11/23 12:29
cerberus452325樓特化功能 x86就什麼都能打但是不精 11/23 15:58
cerberus452326樓就沒辦法同天秤比較 11/23 15:58
NoneWolf27樓老黃能夠駕馭三星製成 高通不行 慘 11/23 19:01
mkzkcfh28樓為什麼體積不用比? 11/23 22:51
ehai072529樓沒事,問就是信仰,讓我們看M1腳踢 11/24 01:02
ehai072530樓5600、拳打3060,信仰讓人偉大 11/24 01:02
延伸閱讀
[閒聊] Toshiba 8T以上非氦氣碟問題
[閒聊] 原價屋蝦皮退貨經驗(結束)
[閒聊] 華碩網站上面的比較主板功能
[閒聊] 一樣的錢 你怎麼選
[閒聊] 買K版只用自動超頻
[閒聊] RM1000X和ASUS Z690 STRIX A 不相容?
[閒聊] LTT HDMI 2.0 (2.1)線測試結論
[閒聊] 疑似買到贓卡