嘛,看到這標題,身為本命愛蜜莉雅的肥宅工程師也來鼓勵(?)分享一下
本肥在112讀大學時修過CSIE田神的ML
猶記得當初只會寫C/C++的自己
在沒人提示的情況下,矇逼的手刻各種矩陣運算,一個作業寫了上千行code
在EE的繁重課業下忍痛停休
然而還是有去把整學期的課聽完,說實話ML/AI背後的數學理論真的收穫很多
後來讀碩班時正好就是李鴻毅開ML的第一年
我也才第一次接觸到python這個暴力且強大的直譯語言
除了有超多數學相關的lib能夠無腦call爆外,最重要的還是處理data的能力
那時瞬間搞不懂自己大學修ML時到底在瞎忙什麼
如果有個拿著流星鎚的藍髮女僕
我會跪求他馬上砸死我,讓我re到大學時期的德田館www
隨著前兩次的作業結束,覺得寫python也太簡單爽快,突然發現自己好想往ML/AI發展
然而學期後半段進入了類神經網路後,一切開始風雲變色
第三次作業的data再怎麼前處理,模型layer再怎麼疊,kaggle上的分數始終慘輸
太無情了,我的信心似乎崩潰了
最後作業結束時,記得老師請前幾名的同學上台分享他們怎麼做的
結果...我震撼了
上台分享的同學大致上也都是亂疊亂串一通,然後分數就突然超高而已
從此,我的AI夢好像也就嘎然而止了
時光荏苒,轉眼間我已是在豬屎屋挑屎挑了三年的肥肥工程師
即使工作內容完全與AI無關
但李鴻毅的那門ML卻是深深的影響著我
自家產品的log項目亂七八糟怎麼辦? python讀出來分類啊
一堆沒用的骯髒數據怎麼辦? 用python踢掉啊
別人給的excel/csv格式排版不是我想要的怎麼辦? python重新輸出啊
反正數據處理方面,python根本神到翻天
再搭配shell語法,各種雜事過來就是一切先自動化處理再說
其實我也不知道別人是怎麼做
但有這些tool對我分析數據上來說就是如虎添翼
但要是我沒修過ML,學到python的處理資料能力
搞不好我現在就還是在用C或人工在處理資料
也許AI風潮不再那麼狂熱,如果AI有顏色那一定是過氣的藍色
但還是很鼓勵可以去接觸看看,也許也能像本肥一樣收穫良多 > <
甚至我認為各個領域都非常有機會運用到處理資料的能力
而透過ML/AI去學習如何處理資料是非常好的一個方式 (燦笑
--
我老婆1
https://imgur.com/VBSwkje 我老婆2
https://imgur.com/wdMQImg我老婆3
https://imgur.com/wkngu3l 我老婆4
https://imgur.com/cOmVBaO我老婆5
https://imgur.com/s6TJwHK 我老婆6
https://imgur.com/cJs96qc我老婆7
https://imgur.com/Mob8u3q 我老婆8
https://imgur.com/qwxYDo5--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.32.243.197 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1636721401.A.262.htmlstmilk1樓屌耶,就像賈伯斯旁聽字體美學一樣,命運就是這麼神奇 11/12 21:03
→ Morphee2樓你講的那些處理 perl跟tcl/tk 不是都玩到爛了? 11/12 22:02
j09583220803樓結果你講的是 python 有多強不是 AI 阿 11/12 22:26
→ j09583220804樓不過說實在的很多 library 底層還是 C 實作才快 11/12 22:27
→ j09583220805樓有些甚至還是 Fortran 11/12 22:27
python的實作跟compiler不是我的重點
我的資料量不會真的大到需要再去了解底層加速
甚至與其去做這種底層研究
我覺得更實際的是要去了解例如多份資料之間要search/match/merge時
怎麼寫到 O(n) 且一份資料盡量只traverse一次
這才是真正大幅減少時間的方式
mmonkeyboyy6樓fortran是沒辦法 11/12 22:32
drajan7樓快很好 但正確 易用 才有市場 11/12 22:36
→ drajan8樓Speed is irrelevant if you are going in the wrong dire 11/12 22:37
→ drajan9樓ction. 11/12 22:37
→ leo0821091710樓這篇是在說 在豬屎用python打雜混的比做ai好嗎XD 11/12 22:48
這也是前幾篇一直提到
你本身的domain knowledge才是最重要的XD
viper970911樓推拿流星槌的藍髮女僕(誤) 11/12 23:42
yamakazi12樓底層Fortran? 11/13 00:07
→ yamakazi13樓Python 底層是C沒錯,但底層Fortran我見識少還真沒聽過 11/13 00:08
j095832208014樓之前看線性代數有用到 lapack 裡面有 Fortran 的語法 11/13 00:29
LincolnBoy15樓Fortran好懷念 好久沒寫了 11/13 00:30
mmonkeyboyy16樓那一堆線代解的裡面很多都有fortran 11/13 01:02
→ mmonkeyboyy17樓不信你下次compile時不要叫 gfortran看看 11/13 01:03
→ mmonkeyboyy18樓立馬死一堆XD 11/13 01:03
→ wahaha27919樓去搞懂直譯的意思 而不是在那邊我見識少 11/13 01:18
shownlin20樓Kaggle有時候真的就是比模型本身的強度 11/13 01:59
→ shownlin21樓有的模型就是特別適合拿來打比賽 11/13 01:59
→ shownlin22樓用對模型基本上分數就會飆上去 11/13 01:59
→ shownlin23樓剩下的就一些細節在那邊看能不能多拼個幾分 11/13 01:59
→ shownlin24樓之前修軒田的final project有感 11/13 02:00
→ shownlin25樓看leader board前面有些組很好心 11/13 02:00
→ shownlin26樓submit還會附上自己用什麼模型XD 11/13 02:00
對 我修完課的確能知道說哪類的問題適合用哪類的模型去解
但我覺得tune參數或神經網路在疊layer的過程真的太難有一個方向或依據
當初我覺得就是在亂搞亂try一通,當然可能也是我功力不夠而已啦XD
然後kaggle上我反而喜歡看別組的組名wwww
我當初也取的超滑超中二XDD
yamakazi27樓我知道有些科學計算用Fortran 啊,我的意思是,有多少主 11/13 09:47
→ yamakazi28樓流套件,或程式,或OS底層是用Fortran?印象中幾乎沒有 11/13 09:47
yamakazi29樓或者本系列主題是AI,有多少搞AI工具底層是Fortran寫的 11/13 09:49
→ yamakazi30樓? 11/13 09:49