[討論] OpenAI GPT o1模型

工作

40360

https://openai.com/index/learning-to-reason-with-llms/
上禮拜OpenAI發布經過強化學習訓練的新型語言模型o1
宣稱模型有更強大的思考能力
o1在回答之前會深入思考產生內部的推理練


結果就是o1模型在各個人類頂尖領域獲得相當好的成績

o1數學方便相當於美國奧林匹克AIME前500名的選手

程式方面位居Codeforce前11%
上禮拜的Leetcode雙週比賽 https://leetcode.com/contest/biweekly-contest-139/ranki
ng/
以12分鐘通關

在物理生物化學領域(GPQA)已經超過人類博士的程度

對科技業比較相關的是 看來以後線上面試考白板題
可能都還要關注面試者眼神有沒有亂飄以防用GPT作弊 但如果是OA好像就無法可防了

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.250.51.3 (臺灣)※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1726539293.A.A27.html
mydear33101樓太興奮了看成OL模型 09/17 10:22
hips2樓現在可以解3.11vs3.9哪個大了嗎? 09/17 10:29
koushimei3樓但是沒辦法貼圖片或者附檔比較麻煩 09/17 10:42
somerabbit4樓搭配cursor使用 ng立刻變senior level 09/17 11:23
lemonsheep5樓不用防吧 以後就不用考白板題啦 09/17 11:29
lemonsheep6樓Gpt 已經比99%的面試者強了 09/17 11:29
lemonsheep7樓以後只剩know how比較重要了 09/17 11:29
這樣看來白板題八股文是不是要走入歷史了 以後也不用刷題了 只是是說這些know how未來也會被GPT取代吧 現在都已經能達到這個程度了 SWE以後可能就是負責下指令然後幫gpt review吧
HiHiCano8樓軟工刷題仔逝去 09/17 11:45
HiHiCano9樓還好台灣大部分是不用刷題的硬體工作 09/17 11:46
musashi02310樓leetcode這種陋習早該下去了 09/17 11:46
Wishmaster11樓gpt的知識量真的屌虐,自己研究個東西可能要兩三小 09/17 11:51
Wishmaster12樓問一下答案直接套用,雖然不能每次都work也夠了 09/17 11:51
HiHiCano13樓軟工的知識在網路上太多了 很容易訓練 09/17 11:52
reprobate14樓看什麼時候能讓我當甲方直接開需求就把軟體含UI都 09/17 12:04
reprobate15樓寫好 09/17 12:04
NTUCS556616樓好像網頁製作可以正確產生 bilibili有人測試 09/17 12:41
NTUCS556617樓直接提需求 code直接寫完 成品網頁直接產生 09/17 12:41
NTUCS556618樓但我走FW的 看不懂他們在幹嘛 感覺有點厲害就是了 09/17 12:42
darkangel11919樓先拿台灣學測的數學戳戳看 09/17 12:43
MAGICMCGRADY20樓刷題其實不算陋習 09/17 12:45
MAGICMCGRADY21樓台廠聊天面試比較像陋習 09/17 12:49
yoyoyolin22樓以前就說了,現場考實作題比較有鑑別度。考那個leet 09/17 13:03
yoyoyolin23樓code 還不如直接挑本科系人選就好。 09/17 13:03
yoyoyolin24樓考實作題本科系還不一定答的出來。 09/17 13:05
MAGICMCGRADY25樓還好啦,面試還會考系統設計 那才是定級的關鍵 09/17 13:07
MagicMomo1926樓是說還真的把整份需求丟上去過,寫是寫的出來但是畫 09/17 13:42
MagicMomo1927樓面醜爆,有資安檢測也不可能過的那種,頂多就是單一 09/17 13:42
MagicMomo1928樓功能能跑能動,可是串不起來整個流程這樣 09/17 13:42
lemonsheep29樓系統設計大部分人也都是唸書本上的再想辦法兜啊 只 09/17 13:43
lemonsheep30樓要是套現成系統性的知識99%的人都贏不了gpt 的 只 09/17 13:43