Re: [請益] 2t 遊戲用SSD選擇(flashid數據研究)

PC購物

1090

好讀
https://www.ptt.cc/bbs/PC_Shopping/M.1742405705.A.8F7.html

先幫樓主拍拍,三爽v6真的雷自己就算了還雷到別人
現在SSD貴森森也只能送修,奇妙的是創見還允許用戶拒用三爽顆粒XD

以下99%內容都是腦補出來的,請看看就好

=

研究了一下樓主flashid給出來的資料,這是很有研究價值的東西
不過裡面的數據並不能完全相信

1.未有官方解釋 2.幾乎只能靠字面意義來推敲,縮寫也很難懂
而且很多的數值都是空的(-1或0),單位更不用說
看到有fail之類的不要自己嚇自己,也別拿這個去和原廠盧,就當參考用

進入主題
一. smi_nvme_flash_id.txt
https://i.imgur.com/EMhw8Bg.png


1.三星v6 136L TLC顆粒、原廠測試壞塊19個、三星D4 DRAM
(創見到底三爽DRAM庫存壓多深==)
2.搞不懂FBlock意思

這是我們看flashid最主要的檔案,上面會有控制器、韌體、顆粒等資訊
精華是下面的遙測(telemetry)數據,這些是控制器所記錄的內部資料
由於NVMe SMART項目都標準化
只能從遙測看以前SATA SSD能看出的ECC、重定位、壞塊資料
而台廠群聯和慧榮的資料剖析方式都有被攻破了
(螃蟹、英韌、聯芸我沒有玩過,所以不知道有無相關資料)


下面的遙測(不同控制器項目會較少,或是可解讀項目不同)
https://i.imgur.com/waNbtUj.png


ECC理論順序為硬LDPC=>(read retry)=>軟LDPC=>RAID ECC
向右修正能力越強但越費時間,SMI整套稱為NANDXtend技術

硬LDPC解碼不行的話就得...

1.TLC read retry(重讀)
重讀就是來回調整電壓看能不能讀出正確數據

2.ECCUnc(軟LDPC失敗)
重讀也不行就得用軟LDPC,耗時較大
正常來說多少會出現的,切勿慌張,因為還有RAID ECC這招

3.重定位和XOR Fail都有相同數值
XOR就是奇偶校驗,也是RAID ECC的原理之一
猜測RAID ECC為最後防線,可以理數值和重定位次數相同
連RAID ECC也沒有辦法就宣告無法恢復了,也就出現ECC錯誤事件


這是我最近從網拍買的MTE220S 512GB(美光/Spectek AS等級96L TLC)
可以看到僅軟LDPC失敗有紀錄,RAID ECC無失敗紀錄
https://i.imgur.com/0hvjNfY.png


實際沒跳0E
https://i.imgur.com/TP3i0L2.png


自用了超過五年的MTE220S 512GB(美光/自封64L TLC)
這條用比上面那條還久,沒想到都沒軟LDPC失敗,可能64L舊顆粒體質更好
https://i.imgur.com/I1nFUWz.png


實際也沒跳0E
https://i.imgur.com/7moRYcT.jpeg


-

二. 至於smi_nvme_flash_id_ec.txt這個是顆粒的磨損值
ec應該為Erase Count(抹除次數),裡面的BAD數量可對應前述19個壞塊

三. smi_nvme_flash_id_smart.txt就單純的NVMe SMART數據
用CrystalDiskInfo也能見到
不過下面有溫度警告的統計次數


四. 那真的壞掉的案例呢?
之前有板友tyf99用Klevv C720爆0E的案例,今天終於能當教材了

phison_e12_flash_id_ec.txt
前面提過這是顆粒的磨損數據
https://i.imgur.com/AVGmBIq.png

可以看到有一整排BAD,這個就是"1片"晶片壞掉
群聯的數據可以看到單獨的晶片,慧榮的好像不行
(正常來說一定都有壞塊的,但不可能這樣整欄BAD,請不要拿這個和客服盧)

phison_nvme_flash_id_smart.txt也有顯示ECC錯誤,包含RAID ECC也沒救
https://i.imgur.com/zxFf1bq.png


SSD外觀顆粒內部是好幾片晶片疊起來
你能看到M.2 2230 TLC用一顆2TB,裡面其實就高達16片NAND Flash晶片
當然SSD正反面貼那麼多顆,全部加起來也會有很多片晶片

--

姊姊 姊姊 我們好像變成簽名檔了

雷姆 雷姆 好像真的是這麼一回事呢


--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.255.51.22 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1742405705.A.8F7.html
knight7141樓這件事最搞笑的是我上個月有打開軟體看 03/20 01:42
knight7142樓過 那時候0E還是0 03/20 01:42
knight7143樓這次出問題一看0E直接變成22萬 03/20 01:42
炸翻XD
E7lijah4樓 03/20 01:43
Depthsharky5樓0E不一定吧 03/20 01:44
Depthsharky6樓我自己體感上使用出問題了 讀出來是0 03/20 01:45
Depthsharky7樓後續讀不到硬碟 重裝重灌 就讀出來 03/20 01:46
個人理解是位於故障區域的資料被用戶操作動到,確認ECC錯誤後才會記錄下來 所以有些三星SSD是用魔術師工具箱"完整掃描"才爆出0E 不然就得等控制器主動refresh碰到 我其實很想寫一篇用Linux nvme-cli自我檢測SSD的文章,但都懶得寫
wensety20078樓詳細推 03/20 02:13
tn6013749樓還好都買金金 fury 03/20 02:54
BlackCoal10樓 03/20 06:11
jack6103111樓超硬知識推一個 03/20 10:36
arenoe12樓 03/20 12:27
Lemming13樓存資料時後面都會加較驗 SSD跟HDD都一樣 03/20 18:34
Lemming14樓因為有bit error rate這種東西 03/20 18:34
Lemming15樓不加下次拿出來的時候不知道有沒有錯 03/20 18:35
Lemming16樓但加的位元數有限不然浪費空間 03/20 18:35
Lemming17樓所已有Uncorrectable BER的概念 03/20 18:36
Lemming18樓SSD一般15次方分之一 企業級17次方 03/20 18:36
Lemming19樓比同級的HDD好太多了 03/20 18:36
Lemming20樓所以讀取校驗時才會發現錯誤 03/20 18:37
Lemming21樓平常沒碰到沒事 我是隔壁看到TEAM客服 03/20 18:37
Lemming22樓在那邊亂回才想起細節的 我大學專題(EE) 03/20 18:38
Lemming23樓做過光纖的BER 道理都類似 03/20 18:38
Lemming24樓其實量夠大都會出現錯誤 但是這次一堆 03/20 18:38
Lemming25樓廠商在那邊誤導 把那種量太大跳出幾個 03/20 18:38
Lemming26樓機率上發生的那種 拿來當成拒絕理由 03/20 18:39
Lemming27樓拜託 他們跳得像是有做到15次方喔幹 03/20 18:39
本人28樓消費級HDD是14次方分之一,再上去15次方 03/20 19:38
本人29樓就NAS、企業級等規格了 03/20 19:39