Re: [請益] 想從零開始轉行當AI軟體工程師

軟工

24172

嘛,看到這標題,身為本命愛蜜莉雅的肥宅工程師也來鼓勵(?)分享一下


本肥在112讀大學時修過CSIE田神的ML

猶記得當初只會寫C/C++的自己

在沒人提示的情況下,矇逼的手刻各種矩陣運算,一個作業寫了上千行code

在EE的繁重課業下忍痛停休

然而還是有去把整學期的課聽完,說實話ML/AI背後的數學理論真的收穫很多


後來讀碩班時正好就是李鴻毅開ML的第一年

我也才第一次接觸到python這個暴力且強大的直譯語言

除了有超多數學相關的lib能夠無腦call爆外,最重要的還是處理data的能力

那時瞬間搞不懂自己大學修ML時到底在瞎忙什麼

如果有個拿著流星鎚的藍髮女僕

我會跪求他馬上砸死我,讓我re到大學時期的德田館www


隨著前兩次的作業結束,覺得寫python也太簡單爽快,突然發現自己好想往ML/AI發展

然而學期後半段進入了類神經網路後,一切開始風雲變色

第三次作業的data再怎麼前處理,模型layer再怎麼疊,kaggle上的分數始終慘輸

太無情了,我的信心似乎崩潰了

最後作業結束時,記得老師請前幾名的同學上台分享他們怎麼做的

結果...我震撼了

上台分享的同學大致上也都是亂疊亂串一通,然後分數就突然超高而已

從此,我的AI夢好像也就嘎然而止了


時光荏苒,轉眼間我已是在豬屎屋挑屎挑了三年的肥肥工程師

即使工作內容完全與AI無關

但李鴻毅的那門ML卻是深深的影響著我

自家產品的log項目亂七八糟怎麼辦? python讀出來分類啊

一堆沒用的骯髒數據怎麼辦? 用python踢掉啊

別人給的excel/csv格式排版不是我想要的怎麼辦? python重新輸出啊

反正數據處理方面,python根本神到翻天

再搭配shell語法,各種雜事過來就是一切先自動化處理再說

其實我也不知道別人是怎麼做

但有這些tool對我分析數據上來說就是如虎添翼

但要是我沒修過ML,學到python的處理資料能力

搞不好我現在就還是在用C或人工在處理資料


也許AI風潮不再那麼狂熱,如果AI有顏色那一定是過氣的藍色

但還是很鼓勵可以去接觸看看,也許也能像本肥一樣收穫良多 > <

甚至我認為各個領域都非常有機會運用到處理資料的能力

而透過ML/AI去學習如何處理資料是非常好的一個方式 (燦笑



--
我老婆1 https://imgur.com/VBSwkje
我老婆2 https://imgur.com/wdMQImg

我老婆3 https://imgur.com/wkngu3l
我老婆4 https://imgur.com/cOmVBaO

我老婆5 https://imgur.com/s6TJwHK
我老婆6 https://imgur.com/cJs96qc

我老婆7 https://imgur.com/Mob8u3q
我老婆8 https://imgur.com/qwxYDo5


--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.32.243.197 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1636721401.A.262.html
stmilk1樓屌耶,就像賈伯斯旁聽字體美學一樣,命運就是這麼神奇 11/12 21:03
Morphee2樓你講的那些處理 perl跟tcl/tk 不是都玩到爛了? 11/12 22:02
我EDA外商的同學說他都在寫perl跟tcl
j09583220803樓結果你講的是 python 有多強不是 AI 阿 11/12 22:26
j09583220804樓不過說實在的很多 library 底層還是 C 實作才快 11/12 22:27
j09583220805樓有些甚至還是 Fortran 11/12 22:27
python的實作跟compiler不是我的重點 我的資料量不會真的大到需要再去了解底層加速 甚至與其去做這種底層研究 我覺得更實際的是要去了解例如多份資料之間要search/match/merge時 怎麼寫到 O(n) 且一份資料盡量只traverse一次 這才是真正大幅減少時間的方式
mmonkeyboyy6樓fortran是沒辦法 11/12 22:32
drajan7樓快很好 但正確 易用 才有市場 11/12 22:36
drajan8樓Speed is irrelevant if you are going in the wrong dire 11/12 22:37
drajan9樓ction. 11/12 22:37
不能同意你更多XD
leo0821091710樓這篇是在說 在豬屎用python打雜混的比做ai好嗎XD 11/12 22:48
這也是前幾篇一直提到 你本身的domain knowledge才是最重要的XD
viper970911樓推拿流星槌的藍髮女僕(誤) 11/12 23:42
他的名字是什麼我一直想不起來 (大誤
yamakazi12樓底層Fortran? 11/13 00:07
yamakazi13樓Python 底層是C沒錯,但底層Fortran我見識少還真沒聽過 11/13 00:08
窩也不知道
j095832208014樓之前看線性代數有用到 lapack 裡面有 Fortran 的語法 11/13 00:29
LincolnBoy15樓Fortran好懷念 好久沒寫了 11/13 00:30
mmonkeyboyy16樓那一堆線代解的裡面很多都有fortran 11/13 01:02
mmonkeyboyy17樓不信你下次compile時不要叫 gfortran看看 11/13 01:03
mmonkeyboyy18樓立馬死一堆XD 11/13 01:03
wahaha27919樓去搞懂直譯的意思 而不是在那邊我見識少 11/13 01:18
shownlin20樓Kaggle有時候真的就是比模型本身的強度 11/13 01:59
shownlin21樓有的模型就是特別適合拿來打比賽 11/13 01:59
shownlin22樓用對模型基本上分數就會飆上去 11/13 01:59
shownlin23樓剩下的就一些細節在那邊看能不能多拼個幾分 11/13 01:59
shownlin24樓之前修軒田的final project有感 11/13 02:00
shownlin25樓看leader board前面有些組很好心 11/13 02:00
shownlin26樓submit還會附上自己用什麼模型XD 11/13 02:00
對 我修完課的確能知道說哪類的問題適合用哪類的模型去解 但我覺得tune參數或神經網路在疊layer的過程真的太難有一個方向或依據 當初我覺得就是在亂搞亂try一通,當然可能也是我功力不夠而已啦XD 然後kaggle上我反而喜歡看別組的組名wwww 我當初也取的超滑超中二XDD
yamakazi27樓我知道有些科學計算用Fortran 啊,我的意思是,有多少主 11/13 09:47
yamakazi28樓流套件,或程式,或OS底層是用Fortran?印象中幾乎沒有 11/13 09:47
yamakazi29樓或者本系列主題是AI,有多少搞AI工具底層是Fortran寫的 11/13 09:49
yamakazi30樓 11/13 09:49