[閒聊] 前炸G/i皇工程師:僅PROG 5090是安全設計

PC購物

標籤:閒聊
69491

https://www.reddit.com/r/pcmasterrace/s/MDplPELwNb

文章很長 我們有請ChatGPT完整翻譯

前言與作者背景

首先要說明幾點:是的,我供職於業界的競爭對手。但我向你保證,這一點絕不會影響我的
觀點。我提到這一點,僅僅是為了有機會教育大家,或許也對用戶和潛在買家敲響警鐘。
曾在 Gigabyte 從事主板設計,不過那已是 17 年前的事了;之後我離開去攻讀博士學位,
而過去 13 年我在 Intel 的晶圓廠工作,還短暫待過 ASML。在 Intel 我參與了 14nm、10
nm、4nm 和 2nm 工藝的項目,同時也對 Foveros 和 PowerVia 等技術有所貢獻。

此文中的所有內容都是我個人的想法、觀點和數據,完全沒有任何零部件製造商或公司的介
入。這是一位硬體愛好者與其他愛好者之間的交流。我並不喜歡不得不這麼說,但現在大家
都知道我站在哪一邊了。

背景:其他連接器及各針腳額定值

我們大家熟悉並喜愛的 8 針連接器,其著名之處在於它能夠承受遠高於其標稱額定功率的
負荷。根據規範,每個針腳額定 9A,也就是在 12V 下,每個針腳能傳輸 108W,這意味著
整個連接器擁有極高的安全裕度,精確來說約為 2.16 倍。而且,如本文後續所討論,這個
裕度甚至還可以再進一步擴大。

相比之下,6 針連接器的設計更加“過度”,它通常含有 2 或 3 個相同類型的 12V 線路
,也就是說這個額定僅 75W 的小連接器,在其可能的 3 個供電針腳上,每一個都能承擔超
過其標稱功率的一部分。即使其中有 2/3 的針腳沒有使用,剩下的針腳仍有餘裕。事實上
,單靠一條額定 9A 的 6 針線路,其安全裕度就比在全負載情況下的 12VHPWR 連接器還要
高,大約有 1.44 倍的餘量。

其實我在這裡對數值稍作保守處理,因為如今許多知名品牌採用的是 mini-fit HCS(高電
流系統)連接器,其額定可以達到 10A甚至更高。甚至在合適的連接器設計下,一個 8 針
連接器可能可以使單一 12V 針腳承受全額的 12.5A,但我還沒找到與這個系列完全匹配、
額定到 13A 的連接器。如果有人知道有這樣的產品,我確實有興趣獲得一些來做一個 450W
的 6 針連接器。重點在於,只要顯卡的 8 針和 6 針連接器數量正確,基本上除非你故意
操作不當或發生嚴重故障,否則連接器熔化的可能性是極低的。

連接器問題:額定過高

接下來我們談談 12VHPWR 連接器。這些較小的針腳並非來自 Molex 的 mini-fit Jr 系列
,而是更小型的 micro-fit 系列。雖然仍可使用 16AWG 線材,但這些連接器通常只額定每
針 9A或 8.5A,這就引出了問題。

依據 8 針連接器的標準,其要求在 12V 下輸出 150W,即 12.5A,平均下來每個針腳大約
需要承載 4.5A。對於額定 9A 的連接器來說,每個針腳實際上只是在其承受能力的一半左
右。而在一個 600W 的 12VHPWR 連接器中,每個針腳就需要承載約 8.33A。如果使用的是
8.5A 額定的針腳,則幾乎毫無裕度;即使是 9A 的針腳,情況也不算理想。這些 8.5A 針
腳在實際情況下,如高環境溫度、表面清潔不充分或 GPU 的瞬間功率尖峰等條件下,都容
易失效,9A 的針腳也好不到哪裡去。

我堅信問題正出在這裡:這些針腳幾乎達到了極限,容錯裕度只有大約 1/6 A,而這對消費
級硬體來說實在太少。安全因子極低。按照 9A × 12V × 6針計算,總額定功率為 648W;
如果使用 8.5A 針腳,則只有 612W。連接器本身據稱能支持最高 660W,所以假設每個針腳
允許有一點超出額定值,或是使用的針腳比我在 Molex 官網上快速查到的稍優,最終的安
全因子也只有大約 1.1 倍。

請記住,對於一個損壞的 6 針連接器,即使只有一個 12V 接口在工作,其安全裕度仍可達
1.44 倍。

似乎這個問題業界已經有一定認識和考慮。下圖摘自 2021 年 11 月發布的 PCIe 5.0 附加
卡規範第三章 3.3 節,描述了 12VHPWR 連接器感應針的配置:

【圖表說明:該圖表列出了 12VHPWR 標準下,針對不同兩感應針配置的功率限制。
– 當兩感應針都處於開路(open-open)狀態時,啟動功率僅 100W,持續負載時為 150W;
– 當兩感應針均接地(ground-ground)時,啟動功率可達 375W,持續負載時最高 600W。


請注意:啟動功率遠低於經過軟體配置後的持續功率。如果軟體配置後功率沒有提升,那麼
通過該連接器的最大功率就只有 375W,這仍是 8 針連接器額定功率的兩倍多。因此,像 5
090 這樣本來需要 4 個 8 針連接器的顯卡,可能就可以節省掉 PCB 上一半的空間。375W
在 12V 下意味著約 31.25A,四捨五入大約 32A,這樣每個針腳只需承載約 5.33A,這就留
有相當的裕度。雖然這個裕度不如 8 針那般寬裕,但考慮到現行規範要求使用的元件品質
已經比 2000 年代最劣質的 8 針(僅 5A、20AWG 線材)要高,而且市面上也可能存在額定
超過 9A 的 micro-fit 針腳,我認為這樣是可以接受的。目前 4080、5080 及以下型號通
常只採用單一連接器,只有部分 OC 版本可能會額外配備第二個 12 針或增加一個 8 針連
接器。

如果以之前 6 針連接器中每個針腳 9A 算,總功率 648W,那麼 375W 的額定就相當於 1.7
2 倍的安全因子。理論上,最少只需 4 個針腳就能承載負荷,剩下仍有約 1.15 倍的裕度
。這大致與最劣質的 8 針連接器(使用弱小的 5A 針腳和 20AWG 線材)的安全極限相當。
即便是我所見過的最劣質的 7A micro-fit 連接器,其安全因子也大約在 1.34 倍左右。

總結來說,連接器本身並沒有問題,主要問題在於其額定功率定得過高,導致安全裕度極低
,這意味著在遇到誤差或其他不完美情況時,很容易超出安全範圍。600W 應該被視為連接
器能承受的絕對最大功率,而實際上 375W 才是一個更合理的額定上限。

Nvidia 的問題(以及合作板卡廠商):拆除了保護措施

作為目前唯一使用該連接器的 GPU 製造商,同時又與 Dell 共同贊助此標準,Nvidia 必須
對此承擔部分責任,但他們的顯卡合作夥伴也有一定責任。

從 3090 FE 和 3090 Ti FE 的設計來看,可以看出設計師非常注重在連接器各針腳之間平
衡負載,將針腳分成 3 對並使電流均衡分布。這正是我記憶中 Nvidia 傳統的板卡設計風
格。他們過去在電源傳輸設計方面做得非常出色,我推測這也是為了給合作夥伴樹立榜樣。
基本上,他們在這個設計中將 12 針連接器視作等同於 3 個 8 針連接器,藉由平衡各針腳
的電流來確保每一組都維持在大約 150W 左右的水平。

在 3090 和 3090 Ti FE 上,每一對 12V 針腳都配有獨立的分流電阻來監控電流,並且板
上還有一些電源切換硬體,據我推測這些硬體用來在各針腳對之間動態調整各自獨立的 VRM
相數。不過,我需要進一步檢查 FE 板卡,從更多實物照片中獲取細節來確認這一點。

接著談談 4090 和 5090 FE 板。這兩款板卡將所有 6 個 12V 針腳合併為一個整體,意味
著無法在各針腳或針腳對之間進行電流平衡。對於 4090、5090 以及我推測其他使用這種連
接器的低階型號來說,這幾乎意味著無法分別監控各個針腳的負載,因為它們只監控整個連
接器的總電流。這讓我不禁質疑,到底是誰批准了這種設計——我曾經參與過主板設計,實
在無法理解除了節省成本之外,還有什麼理由要去掉這樣一個明顯關鍵的安全特性,而這些
成本在大規模生產中只不過是單位數美元甚至幾美分。特別是在 4090 顯卡故障之後,仍然
在 50 系列中保留這種設計決策,實在讓人難以接受,因為那時已經有明確跡象表明需要改
變。那些連接器在達到額定功率 3/4 時就已經出現故障,但他們卻選擇在沒有對電源電路
做出實質改進的情況下,繼續提高連接器中傳輸的功率。

ASUS 以及可能還有其他我尚未提及的廠商,似乎至少試圖緩解這種危險。ASUS 的 ROG Ast
ral PCB 在將所有 12V 針腳合併成一個整體之前,增加了一組第二分流電阻,每個針腳都
有獨立的監控。據我了解,這套系統可能無法真正實現針腳間的動態負載轉移,但至少能夠
監測到任何異常,從而警告用戶,或者甚至自動採取措施(例如功率限制或關閉系統)以防
止損壞或危險。對於允許超過基本 375W 功率通過連接器的設計來說,這應該是最基本的安
全要求。

再往上一步的保護措施是,在兩組 3 針腳之間實現主動電源切換,這一點並不難實現,而
且對我個人來說,也是我在購買顯卡時最低會接受的要求。3090 FE 顯卡採用的 3 對 2 針
腳配置顯示,這樣的方案在實際使用中並未引發頻繁或災難性的故障,也正好屬於這個範疇


如果有 OC 版本的顯卡打算在單一連接器上超過 575W 功率,那麼對所有 6 個針腳進行監
控與切換就應該成為必備條件。就我個人而言,我希望所有超過 500W 的顯卡都具備這種保
護,因此每一款 5090,甚至許多 4090 都應該如此。儘管對於如此高功率的顯卡,我仍然
希望能有多個連接器,但至少若單一連接器能有這級別的保護,我會更有信心使用它。

未來應採取的措施:避免、退貨與召回

我的觀點是:任何通過 12VHPWR 連接器輸出超過基本 375W 功率的顯卡都應該被避免購買
。目前所有僅用單線連接的 4090 和 5090 都屬於此類,而 5080 的功率(約 360W)則處
於臨界狀態。

我希望看到那些未採取上述最低保護措施的顯卡被認定為危險且可能存在缺陷,進而被召回
。當然,要達到這一點,可能需要對 Nvidia 及其合作的板卡製造商採取大規模的法律行動
。這些廠商似乎認為這沒什麼問題,直到消費者把這問題變成自己的問題。

如果你懷疑自己的顯卡可能存在風險,那就退貨拿回你的錢,然後把錢花在別的地方。畢竟
,2000 多美元還能買到很多東西。如果他們打算賣給你一個潛在危險、缺乏關鍵安全機制
的產品,那他們就不配得到你的錢。這不僅適用於 Nvidia,AMD 和 Intel 也一樣,老實說
,對任何公司都應如此。


簡單來說著介面就是爛 容錯率比以往小很多(1.1倍 vs 以往輕鬆2倍以上

這個專業人士也點出前幾天版友提出的問題 就是電源設計部分
都是參照公版電源喇在一起的設計
除了共碩PROG 加入了電流監控 前一篇5080燒起來就是一個很好的例子

但共碩也就只做到監控後打住 也沒進一步得負載轉移或是功率限制(共碩目前應該是只有
做到警告而已)
至少式不錯的第一步了
所以PROG這下貴的有理了 ㄎㄎ

你各位啊 搶不到5090或許是好事嗎 ㄎㄎ

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.80.236 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1739456174.A.B55.html
BJshow1樓難怪NV設計5080從上市前的400w>360w 看來 02/13 22:20
BJshow2樓早知道了吧 02/13 22:20
kaj19833樓那5080超頻的風險就不是當機了,是燒機.. 02/13 22:21
kaj19834樓本以為5080超一下就可以看到4090車尾燈 02/13 22:21
dragonfly6675樓真的超到冒煙 02/13 22:23
friedpig6樓FE真的不知道哪來自信直接把他併起來 等 02/13 22:24
friedpig7樓於那小片上面要直接跑50A 02/13 22:24
Depthsharky8樓避免..看消費者多飢渴 02/13 22:26
Depthsharky9樓召回 看生產端真的有當回事? 02/13 22:27
william45610樓那4090也只剩名人堂可以買 02/13 22:27
Depthsharky11樓退貨(X)囤貨(O) 02/13 22:27
maplefoxs12樓根本就是故意的,8pin用好好的硬要改1 02/13 22:28
maplefoxs13樓6pin,結果還不如8pin 02/13 22:28
william45614樓只能期待美國消費者了 02/13 22:28
maplefoxs15樓下一代再換個接頭,各位又可以換電源 02/13 22:28
maplefoxs16樓 02/13 22:28
william45617樓而且夜神也無法做到阻斷吧,僅能告知 02/13 22:29
william45618樓,人不在身邊就 02/13 22:29
william45619樓且目前曝光的工程板是4x16 02/13 22:30
baddaddy20樓沒有安全的,那張卡只是跳通知警告你而 02/13 22:31
baddaddy21樓 02/13 22:31
twic22樓我看要全面停產等5080s了 02/13 22:32
allyourshit23樓就是所有接線狀態必須完美 02/13 22:32
allyourshit24樓幾乎沒什麼容錯空間 一點錯誤就燒熔 02/13 22:33
a12345469825樓電流太高,下一代搞不好走24v 02/13 22:33
Depthsharky26樓跳通知 但模型實驗還在跑(X 02/13 22:33
a7794200227樓終於要開始檢討這個爛設計了? 02/13 22:37
kuninaka28樓600W的16PIN,太危險了 02/13 22:40
spfy29樓他們不可能不知道吧 02/13 22:40
NanaMizuki30樓整個規格的安全冗餘不到10% 02/13 22:41
延伸閱讀
[閒聊] 海盜船是不是待不下去了
[閒聊] 請問關於現在組跟過一陣子組(更新自己配備
[閒聊] 技X是被NV看沒有 還是看死忠的沒有?
[閒聊] 羅技滑鼠新品故障
[閒聊] NCC 750之亂暫緩收費 先進口之後再收錢
[閒聊] WD復活SanDisk 往後SSD都改掛SD HDD掛WD
[閒聊] NCC 750之亂 2件內都750 RMA客服紀錄即可
Re: [閒聊] 悲劇! RTX 4080 SUPER 通路斷貨了!下課!