[情報] 50美元訓練出媲美DeepSeek R1

股票

69939623


標題:

李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型

來源:
Futu

網址:

https://tinyurl.com/ydrtdbu8

內文:

李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的雲計算費用訓練了一個名
叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSe
ek的R1等尖端推理模型類似。研究人員表示,s1是通過蒸餾法由谷歌推理模型Gemini 2.0
Flash Thinking Experimental提煉出來的。


https://i.imgur.com/kFg9GjU.jpeg


斯坦福大學以及華盛頓大學的研究團隊展示了一種極低成本的 AI 訓練方法,被稱為 S1


S1 僅使用 6 美元就能達到 OpenAI o1-preview 級別的推理性能!同時匹敵Deepseek R1

推理時間可控:S1 通過簡單的“Wait”機制,控制大模型的思考時間,提高推理能力。

S1 不是 OpenAI o1 或 DeepSeek R1 的直接復刻,但它揭示了在推理時微調 AI 的潛力
,甚至可以媲美 Reinforcement Learning(強化學習)。

OpenAI 和 DeepSeek 早期研究發現,AI 在回答問題時“思考得更久”,往往能得出更好
的答案。但過去並沒有清楚解釋:如何在推理階段控制 AI 的思考時間?

S1 的創新點: S1 論文提供了推理時間擴展(Inference Scaling)的具體實現方法:

核心思想:

如何在不改變 AI 訓練過程的情況下,提高 AI 解決複雜問題的能力?

方法:讓 AI 在推理時“多想幾秒”,自動檢查自己的答案,從而減少錯誤,提高正確率


結果證明,這種方法比 OpenAI o1-preview 還要好!

最重要的是:而且只用了 1000 道題! 這比一般 AI 訓練的數據少了 800 倍,但效果仍
然很強!

此外,該模型可以在筆記本電腦上運行,並且其訓練成本僅為 6 美元。

論文下載

https://arxiv.org/pdf/2501.19393


--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.195.108 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738832169.A.8EF.html
joygo1樓好便宜!!! 02/06 16:56
budaixi2樓 02/06 16:56
kkes00013樓 02/06 16:56
justin8182814樓不用錢,我的腦就是R1 02/06 16:57
ohohohya5樓完了 地動山搖 02/06 16:57
kotorichan6樓R1很強 02/06 16:57
kkes00017樓Gamini 2.0不是剛出不到一天 02/06 16:57
appledick8樓提煉再提煉 02/06 16:58
Akitsukineko9樓你肥肥團隊 02/06 16:58
Subzero000010樓哈哈 過一陣子 會不會出現0.5美元就可以搞定 02/06 16:58
LeMirage200011樓變伏特加了吧這個 02/06 16:58
jimmy1233212樓這啥 白菜價? 韭菜價? 02/06 16:58
IBIZA13樓多想幾秒鐘 你可以不要... 02/06 16:58
kotorichan14樓AI白菜價 02/06 16:59
hsu061215樓openai又要發作了嗎 02/06 16:59
zerro716樓真的白菜價了 02/06 16:59
appledick17樓要遍地AI了 02/06 16:59
b206002783018樓那誰要當第一個訓練的? 02/06 17:00
appledick19樓然後發現 這AI我根本很少用到啊 02/06 17:00
PureAnSimple20樓丸子 沒有最便宜 只有更便宜 ㄟ唉末日 02/06 17:00
guagua110121樓這很常見…不用大驚小怪 02/06 17:01
zerro722樓結果最後大家都去別人的水桶裡面釣魚耶 笑死 02/06 17:01
a6418640123樓丸子 原來搞AI那麼便宜 02/06 17:01
sheep200924樓以後沒人想開源了 大家自己買nv晶片訓練大模型 02/06 17:02
boomberm25樓太唬爛了,能信嗎 02/06 17:02
mumeisuki26樓卷爛 02/06 17:02
grtfor27樓你釣他水桶裡的魚,我釣你水桶裡的魚,大隊接力 02/06 17:02
Feting28樓看來ai普及速度極快,終端裝置準備大噴發QQ 02/06 17:03
MVPkobe29樓看不懂 02/06 17:03
ymlin033130樓NV我們不要了 02/06 17:03