原文標題:馬斯克吹了半年的模型終於發布:Grok 3 你需要知道的所有信息
原文連結:https://news.qq.com/rain/a/20250218A04EFA00
發布時間:2025-02-18 13:29
記者署名:歸藏
原文內容:
從 24 年底馬斯克就開始給他們新建巨大計算中心訓練的 Grok3 模型開始預熱了,今天中午 12 點的直播活動中終於發布了 Grok3。
這次馬斯克開始玩真的了,不僅模型的素質跟上了 Open AI 的 O1,而且在產品功能上全面對標 ChatGPT。
訓練的硬件
Musk 聲稱 Grok 3 的開發使用了比其前身 Grok 2「10 倍」多的計算資源,xAI 一直在使用位於孟菲斯的一個龐大數據中心——一個包含約 20 萬個 GPU 的數據中心——來訓練 Grok 3。其中的一期工程只用了 122 天就完成了,工程這塊還得看馬斯克。
圖片
模型能力
Grok 3 的訓練量是 Grok 2 的 10 倍,在 1 月初完成了預訓練,即使現在依然在訓練過程中。
Grok3 包含兩個模型版本 Grok3 和 Grok3-mini,Grok 3 AIME 和 GPQA 在內的基準測試中顯著優於其他模型,如 Gemini 2 Pro 和 GPT-4o。即使是 Grok-3 mini 也表現不錯。目前的早期版本在 Elo 機製的 LLM 競技場 1400 分排第一。
圖片
同時 Grok3 也具備推理能力,馬斯克表示在代碼能力上 Grok3 非常強,同時在推理時不會展示原始思考過程。
至於推理性能,在提供更多測試時間計算資源(使其能夠思考更長時間)的情況下,它優於 o1 和 DeepSeek-R1。
Grok 3 Reasoning Beta 在 AIME 2025 上的表現也高於 o3-mini-high。
圖片
深度搜索功能
除了模型能力對標 Open AI 之外,前沿的 Agents 能力也必須跟上,Grok3 支持類似 Open AI 深度研究的 DeepSearch能力。
這個功能模型能夠深入思考用戶意圖、需要考慮哪些事實、要瀏覽多少個網站、可以交叉驗證不同來源,確保信息的真實性。DeepSearch 還會公開其執行搜索本身所采取的步驟。
圖片
如何使用和收費
目前最先可以體驗到 Grok3 的渠道應該是推特的 X Premium+ 會員,同時他們也推出了單獨的 Grok 網站和 APP。
另外還有搭配單獨有用的 Super Grok 會員,支持 Grok 3的權限、解鎖DeepSearch和Think功能、搶先體驗新功能、更高的圖像生成限製等。
圖片
未來規劃
網頁和應用的所有功能會在一周內推全、API 會在幾周內推出。
一周後還會有由 Grok 驅動的語音應用即將推出。
另外 Grok2 可能會在幾個月後開源,最後一個版本將在最新版本完全發布後開源。
心得/評論:
grok3相當於在給deepseek打配合吧。
花了DS200倍的訓練成本,提高了一點點分數。恰恰證明了堆硬件的路徹底走不通了,毫無意義
我覺得今晚NASDAQ跌的就是這個吧。還有什麽原因呢
--
當心,被擊沉的推文跟班有:
LiXX FaXX LuckXX DrGXX shiriXX downtoearXX stanthemXX liweitseXX
--