[新聞] 陸DeepSeek走紅!開發者是「95後」天才

八卦

24515226


1.媒體來源:

UDN


2.記者署名:


2025-01-27 14:08 聯合報/ 記者
陳言喬
/即時報導


3.完整新聞標題:

陸DeepSeek走紅!開發者是「95後」天才少女 Meta組4團隊應對


4.完整新聞內文:


大陸AI新創公司DeepSeek近來迅速走紅,令矽谷十分緊張。DeepSeek-V2的關鍵開發者之
一是被稱為95後AI「天才少女」羅福莉。小米創始人雷軍以人民幣千萬元年薪招攬羅福莉
,領導小米AI大模型團隊。


紅星資本局報導,2024年底,DeepSeek發布了新一代大語言模型DeepSeek-V3,同時宣布
開源。1月20日,DeepSeek發佈新模型DeepSeek-R1並同步開源模型權重,再次引發全球AI
科技圈關注。


DeepSeek昨天(26日)曾出現短時閃崩現象,DeepSeek回應稱,當天下午確實出現了局部
服務波動,但問題在數分鐘內就得到了解決。此次事件可能是由於新模型發布後用戶訪問
量激增,伺服器一時無法滿足大量用戶的併發需求。


紅星資本局指,在多項基準測試中,V3的成績超越了主流開源模型,並和世界頂尖的閉源
模型不分伯仲。同時,由於其極低的訓練成本,DeepSeek-V3被稱為「AI界拼多多」。


公開資料顯示,DeepSeek來自杭州「深度求索人工智慧基礎技術研究有限公司」(下稱「
深度求索公司」),專注於開發先進的大語言模型和相關技術,由大陸知名量化資管巨頭
「幻方量化」於2023年7月創立,也因此獲得資本市場的廣泛關注。


而DeepSeek-V2的關鍵開發者之一羅福莉也迅速走紅,她被稱為95後(1995年以後出生)
AI「天才少女」。羅福莉本科就讀於北京師範大學電腦專業,碩士畢業於北京大學計算語
言學專業。


碩士畢業後,羅福莉先是進入阿里達摩院做人工智慧研究,從事預訓練語言模型相關的工
作,負責阿里達摩院AliceMind開源專案,主導開發了多語言預訓練模型VECO。


2022年,羅福莉加入「幻方量化」從事深度學習相關策略建模和演算法研究,後又跳槽到
DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek-V2。


就在DeepSeek-V3發布前幾天,小米創始人雷軍已開出千萬年薪招聘羅福莉,領導小米AI
大模型團隊。


DeepSeek的爆火後,登頂蘋果中國和美國應用商店免費APP下載排行榜,超越了ChatGPT。


澎湃新聞報導,在國外大模型排名榜Chatbot Arena上,DeepSeek-R1的基準測試排名已經
升至全類別大模型第3,與OpenAI的ChatGPT-4o最新版並列。不過,DeepSeek-R1的預訓練
費用為557.6萬美元,不到OpenAI GPT-4o模型訓練成本的十分之一。


紅星資本局稱,DeepSeek公司的北京子公司正在招人,現共釋出52個崗位,包括深度學習
研究員、核心系統研發工程師以及資深ui設計師等。其中,薪資最高的為核心系統研發工
程師(校招),薪資範圍人民幣6至9萬元;大部分崗位的起薪在人民幣2萬元及以上。


DeepSeek以其研發的極低成本優勢,引起美國矽谷等AI公司的緊張。澎湃新聞27日引述
Information網站報導,臉書母公司Meta已成立了4個專門研究小組來研究量化巨頭「幻方
量化」旗下的國產大模型DeepSeek的工作原理,並基於此來改進旗下大模型Llama。


其中2個小組正在試圖了解「幻方量化」如何降低訓練和運行DeepSeek的成本;第3個研究
小組則正在研究「幻方量化」可能使用了哪些資料來訓練其模型;第4個小組正在考慮基
於DeepSeek模型屬性重構Meta模型的新技術。


據DeepSeek介紹,R1的預訓練費用只有557.6萬美元,在2048塊英偉達(輝達)H800 GPU
(針對中國市場的低配版GPU)集群上運行55天完成,僅是OpenAI GPT-4o模型訓練成本的
不到十分之一。一經推出,DeepSeek-R1便憑藉其物美價廉的特性在海外開發者社區中引
發了轟動,更是憑藉極低的訓練成本震撼了矽谷。


數日前,有Meta的工程師們在匿名社交平台TeamBlind上吐露心聲,表示DeepSeek所研發
的AI模型為其帶來了巨大壓力。


5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體:

https://udn.com/news/story/7333/8517100?from=redpush

6.備註:

五樓愛蘿莉




--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.223.105.209 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1737963005.A.090.html
ncc55661樓有圖 我12了 01/27 15:31
syura9452樓熊福利 01/27 15:31
zoeapezoo3樓Chatdpp 吊打 01/27 15:31
Forcast4樓羅福利 01/27 15:31
Moneysay5樓meta是在緊張的? 是不是中國一條龍 01/27 15:32
stuxxv6樓我們有抗中保台 IT天才部長 有郎摸 01/27 15:32
gn13841817樓大陸的頂尖理工技術人才真的多 01/27 15:32
hljjun8樓反觀台灣年輕一輩有89跟閩南蟲 01/27 15:33
wertes9樓葬送的福莉羅 01/27 15:33
gn138418110樓反觀美國的年輕人都去搞金融或嗑藥嘿皮 01/27 15:33
e04x811樓長得像女生耶 01/27 15:34
yoshilin12樓會被暗殺或是招募去美國吧 01/27 15:34
yoshilin13樓不過中國薪資也蠻厲害的 01/27 15:35
yoshilin14樓這篇會不會是ai故事啊? 01/27 15:35
butten98615樓這是要葬送openai的意思? 01/27 15:36
butten98616樓志氣真高 01/27 15:36
pyrolith17樓這也太吹了吧 01/27 15:36
GaussQQ18樓但是這個有可供公開驗證的open source。 01/27 15:36
GaussQQ19樓不管故事如何,至少library 是真的 01/27 15:37
jarrodqq89620樓熊福利 01/27 15:37
sm90520221樓當中國吹技術跟人的時候,就聽聽就好 01/27 15:37
gn138418122樓憨鳥...中國每年都有數十萬的理工技術 01/27 15:37
LBruce23樓福利蘿 蘿福利 01/27 15:37
gn138418124樓人才,中國人本來就很勤奮又聰明,能蹦 01/27 15:38
CLOSED25樓台灣不是很有錢 花2000萬人民挖過來就好 01/27 15:38
gn138418126樓出什麼新科技並不奇怪好嗎 01/27 15:38
pyrolith27樓gn士官又開始大談了 01/27 15:38
CLOSED28樓那個數發部的預算全部拿來挖人才 01/27 15:38
gn138418129樓美國國家科學學院院刊報導稱44%中國大 01/27 15:39
gn138418130樓學生主修自然科學工程學,反觀美國只有 01/27 15:40