[新聞] 馬斯克吹了半年的模型終於發布:Grok 3 你需要知道的所

股票

70454

原文標題:馬斯克吹了半年的模型終於發布:Grok 3 你需要知道的所有信息
原文連結:https://news.qq.com/rain/a/20250218A04EFA00
發布時間:2025-02-18 13:29
記者署名:歸藏
原文內容:

從 24 年底馬斯克就開始給他們新建巨大計算中心訓練的 Grok3 模型開始預熱了,今天中午 12 點的直播活動中終於發布了 Grok3。 

這次馬斯克開始玩真的了,不僅模型的素質跟上了 Open AI 的 O1,而且在產品功能上全面對標 ChatGPT。 



訓練的硬件
Musk 聲稱 Grok 3 的開發使用了比其前身 Grok 2「10 倍」多的計算資源,xAI 一直在使用位於孟菲斯的一個龐大數據中心——一個包含約 20 萬個 GPU 的數據中心——來訓練 Grok 3。其中的一期工程只用了 122 天就完成了,工程這塊還得看馬斯克。 

圖片
模型能力
Grok 3 的訓練量是 Grok 2 的 10 倍,在 1 月初完成了預訓練,即使現在依然在訓練過程中。 

Grok3 包含兩個模型版本 Grok3 和 Grok3-mini,Grok 3 AIME 和 GPQA 在內的基準測試中顯著優於其他模型,如 Gemini 2 Pro 和 GPT-4o。即使是 Grok-3 mini 也表現不錯。目前的早期版本在 Elo 機製的 LLM 競技場 1400 分排第一。 

圖片
同時 Grok3 也具備推理能力,馬斯克表示在代碼能力上 Grok3 非常強,同時在推理時不會展示原始思考過程。 

至於推理性能,在提供更多測試時間計算資源(使其能夠思考更長時間)的情況下,它優於 o1 和 DeepSeek-R1。 

Grok 3 Reasoning Beta 在 AIME 2025 上的表現也高於 o3-mini-high。 

圖片
深度搜索功能
除了模型能力對標 Open AI 之外,前沿的 Agents 能力也必須跟上,Grok3 支持類似 Open AI 深度研究的 DeepSearch能力。 

這個功能模型能夠深入思考用戶意圖、需要考慮哪些事實、要瀏覽多少個網站、可以交叉驗證不同來源,確保信息的真實性。DeepSearch 還會公開其執行搜索本身所采取的步驟。 

圖片
如何使用和收費
目前最先可以體驗到 Grok3 的渠道應該是推特的 X Premium+ 會員,同時他們也推出了單獨的 Grok 網站和 APP。 

另外還有搭配單獨有用的 Super Grok 會員,支持 Grok 3的權限、解鎖DeepSearch和Think功能、搶先體驗新功能、更高的圖像生成限製等。 

圖片
未來規劃
網頁和應用的所有功能會在一周內推全、API 會在幾周內推出。

一周後還會有由 Grok 驅動的語音應用即將推出。

另外 Grok2 可能會在幾個月後開源,最後一個版本將在最新版本完全發布後開源。


心得/評論:

grok3相當於在給deepseek打配合吧。
花了DS200倍的訓練成本,提高了一點點分數。恰恰證明了堆硬件的路徹底走不通了,毫無意義

我覺得今晚NASDAQ跌的就是這個吧。還有什麽原因呢

--
當心,被擊沉的推文跟班有:
LiXX FaXX LuckXX DrGXX shiriXX downtoearXX stanthemXX liweitseXX

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 171.14.60.249 (中國) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1739978254.A.F0B.html
gino07171樓可以色色嗎 02/19 23:18
SRNOB2樓沒強多少 1%多 耗能更多 02/19 23:20
zzzbear3樓也吹太久 02/19 23:21
qwe789714樓貴 沒什麼用 目前跟各大佬聊 價格一致看衰 02/19 23:21
SRNOB5樓大力出奇蹟已經出現邊際效益遞減 02/19 23:21
s16123166樓只要還不是獨大 成本就別想回收 02/19 23:25
s16123167樓收費至少要再少一百倍 02/19 23:26
gladopo8樓馬老闆的東西不用回收,再吹一下就一堆融資 02/19 23:27
ter27889樓OPENAI做一個我也做一個 明明是差不多的東西但錢還 02/19 23:29
ter278810樓是要花 02/19 23:29
ter278811樓這是力大飛磚 但也是做差不多的東西 02/19 23:29
gladopo12樓他就看openai不爽啊,要自己搞一個 02/19 23:31
SRNOB13樓這條路有點到底了 資料也都訓練完 只能另辟蹊蹺 02/19 23:31
SRNOB14樓微軟最近放一個重磅的 GitHub 衝分好高 02/19 23:32
Orianna15樓10倍資源? omg 那有幾倍功效嗎 02/19 23:33
ter278816樓現在最大問題是 這樣堆真能AGI? 02/19 23:34
simba122217樓覺得再過不久就會把各家模型拿去軍用,再讓他們對 02/19 23:35
simba122218樓打,決定誰最強 02/19 23:35
Ceferino19樓整天只會吹,看起來就像把別人論文寫的東西跟架構 02/19 23:36
Ceferino20樓用他的20萬張gpu跟海量資料復現而已 02/19 23:36
s9000244221樓tsla乖乖回300吧 02/19 23:38
gamixxxx22樓最後上車時間 All in Tsll 02/19 23:41
seemoon200023樓這就跟讀書一樣啊 你要全科PR80 沒有太困難 但你要 02/19 23:44
dongdong040524樓TSLA還沒買夠啊 02/19 23:44
seemoon200025樓全科PR90以上 投入的時間和效益會越來越低阿 02/19 23:45
oyaji556626樓人家都開源了你還在收費 02/19 23:46
CYL00927樓馬斯克很會做直銷的啦 安啦 02/19 23:48
e123456ddd28樓又一個覺得自己比巨頭們聰明的 02/19 23:48
liangnet29樓說不定差那分數就差多了,畢竟使用者最終要的是可 02/19 23:51
liangnet30樓以回答他正確的答案,而不是瞎掰的答案。 02/19 23:51
更多新聞
[新聞] 日能源政策轉彎 擴大用核電
[新聞] BYD CEO:中國電車領先世界3-5年
[新聞] 頭條揭密》低階過剩高階緊缺 舉國體制能
[新聞] 經理人搶買股票!美銀:基金現金部位創15
[新聞] 高雄P4、P5廠環評中 陳其邁:市府會與台
[新聞] 外媒曝台積電沒興趣吃下英特爾 雙方「1關
[新聞] DS引爆恆生科技股飆逾26% 中國股民爆買
[新聞] 蛤?GB300還是會用超級電容 郭明錤自打臉