Re: [討論] 寫三元判斷式code review被打槍

軟工

1280

: 標題: Re: [討論] 寫三元判斷式code review被打槍
: 時間: Sat Dec 17 03:51:38 2022
: 很多Javascript 高手都是用 switch 取代

"特定"情況下的確是好方式

舉個例子 以前我在調校能時候有用過這種方式 這是c#的code部分節錄

void Mem_w(ushort address, byte value)
{
if (address < 0x2000) NES_MEM[address & 0x7ff] = value;
else if (address < 0x4020) IO_write(address, value);
else if (address < 0x6000) MapperRouterW_ExpansionROM(address,value);
else if (address < 0x8000) MapperRouterW_RAM(address, value);
else MapperRouterW_PRG(address, value);
}

這個是一個非常頻繁被呼叫的method 如果address 大於等於0x8000
其實前面就浪費好幾次計算在判斷式上

因此改成 功能上是相等的

static void Mem_w(ushort address, byte value)
{
switch (address & 0xf000)
{
case 0:
case 0x1000:
NES_MEM[address & 0x7ff] = value;
break;
case 0x2000:
case 0x3000:
case 0x4000:
IO_write(address, value);
break;
case 0x5000:
MapperObj.MapperW_ExpansionROM(address, value);
break;
case 0x6000:
case 0x7000:
MapperObj.MapperW_RAM(address, value);
break;
case 0x8000:
case 0x9000:
case 0xa000:
case 0xb000:
case 0xc000:
case 0xd000:
case 0xe000:
case 0xf000:
MapperObj.MapperW_PRG(address, value);
break;
}
}

但再簡化快速下去還有大招

初始化執行一次就好
static void init_function()
{

mem_write_fun = new Action<ushort, byte>[0x10000];
for (int address = 0; address < 0x10000; address++)
{
if (address < 0x2000) mem_write_fun[address] =
new Action<ushort, byte>((addr, val) => { NES_MEM[addr & 0x7ff] = val; });
else if (address < 0x4020) mem_write_fun[address] =
new Action<ushort,byte>(IO_write);
else if (address < 0x6000) mem_write_fun[address] =
new Action<ushort, byte>(MapperObj.MapperW_ExpansionROM);
else if (address < 0x8000) mem_write_fun[address] =
new Action<ushort, byte>(MapperObj.MapperW_RAM);
else mem_write_fun[address] =
new Action<ushort, byte>(MapperObj.MapperW_PRG);
}
}

之後讀取

[MethodImpl(MethodImplOptions.AggressiveInlining)]
static void Mem_w(ushort address, byte value)
{
mem_write_fun[address](address, value);
}

實際上跟switch原理很相似 但直接把mapper的實作 哪個address對應啥動作
直接寫到記憶址array去了

我是不知道你所謂的javascript高手用switch替代判斷式是碰到啥議題

但特定議題用改用switch 甚至自己刻死路由效能是會快非常多

以前有筆記在這邊...
https://dotblogs.com.tw/enet/2017/01/21/emu_optimization_1


--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.15.64.117 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1672067047.A.133.html
MoonCode1樓... 12/26 23:47
MoonCode2樓快不快還是 benchmark 或看編譯出來什麼東西吧 12/26 23:48
有用FPS測過 提升很大 看到前面有人推文提到 ARRAY LOOKUP最快 其實就是這種方式
MoonCode3樓 12/27 00:01
jason2223334樓 12/27 06:32
DarkIllusion5樓好奇問 為什麼這裡switch-case會比多重if-else快? 12/27 06:48
DarkIllusion6樓以及 為什麼這裡用function map比switch-case快? 12/27 06:50
DarkIllusion7樓如果頻繁判斷address大於等於0x8000 那這判斷放前面 12/27 06:55
沒人知道 ADDRESS到底是落在哪個區間多 這就問題
DarkIllusion8樓為什麼不會是個好的解法? 12/27 06:56
Jichang9樓這不是大一計概就會教的 if else 是循序判斷 switch 是ju 12/27 06:58
Jichang10樓mp map是hash 但是好的compiler可以直接最佳化if else 12/27 06:58
DarkIllusion11樓抱歉 我比較沒有計概常識 12/27 07:01
最終結果其實是多重因素下複合產生的 所以與其問為什麼 最快其實就是跑看看才準 當然要從理論層出發談談也不是不行 但談理論有時候實際就會是出乎意料 至於 if else -> switch -> array lookup case多時候為啥比較快 循序判斷本身就是計算成本 至於switch跟array lookup其實精神上是類似做法 就一個查表動作 不過還是得實際測一下 有時候這也跟實際case有關係 就所處電腦硬體條件 如果RAM慢到一個程度 慢到一次查表 乾脆讓CPU去完成幾次計算 還比一次查表快 那就用if else 後來發現一切理論都沒那麼可靠 要考量的太多 實測就知道答案 而且實測的答案 說不定在不同硬體條件下又是別的狀況 C#會輸出IL CODE看IL CODE也不太準 看JIT編譯出的東西才知道真正做啥事情 知道真正做啥事情 有時候也要考慮到硬體差異 查表法說白了就是先將答案算出來記錄下來 直接查 是存取記憶體ARRAY的COST 計算量大時候 先算計下來會比較快 但如果記憶體存取的COST高於重算幾次的CPU計算 那乾脆就重算一次.... 這些都不是非常一定 直接測一測是最好的方式 剩下都紙上談兵 意料之外的結果會常常發生
DarkIllusion12樓看來原PO用的是沒那麼好的compiler :( 12/27 07:07
微軟在C#輸出的優化應該已經是標竿了
leolarrel13樓單純補充一下,這應該不適合在C. 剛用gcc 看組語內容, 12/27 13:44
leolarrel14樓switch 仍然用比較且跳躍來實作 12/27 13:44
其實就像前面說的 真的都要實際跑看看才準或是看到ASM層去才比較有意義 沒有一定的萬用通則
MyNion15樓你下面陣列開了六萬多個再用for去跑,真的需要那麼多個? 12/27 15:54
MyNion16樓因為你的case只有五種,要不要數字進來都/5,這樣較省空間 12/27 15:56
chuegou17樓就算是C 還可以問你優化編譯有沒有開 12/27 22:08
peter9818樓這種其實沒甚麼好討論的 就算真的這樣做有用 也只是單 12/27 22:35
peter9819樓一case適用 另外 profiling的情況是有規定的 不是隨便 12/27 22:35
peter9820樓跑 上次不知道哪個人開debug mode做profiling 原本想說 12/27 22:36
peter9821樓甚麼 後來想想還是算了 12/27 22:36
peter9822樓打錯 我是指開IDE去run程式做profiling 12/27 22:38
wulouise23樓開IDE跟profiling是之間沒有關係,除非開debug build 12/28 12:27
leolarrel24樓chuegou, 我用gcc -O0跟-O3測試.你也可以自己試試看 12/28 13:19
ku39999925樓好奇效能差很多最後是快多少 func功能還是比條件判斷 12/30 09:37
ku39999926樓佔更多執行時間才對 12/30 09:38