[新聞] 三位臺灣AI專家發起DeepSeek R1改造計畫,要打造繁中版

股票

21012629

原文標題:

三位臺灣AI專家發起DeepSeek R1改造計畫,要打造繁中版開源授權的推理模型

原文連結:https://ithome.com.tw/news/167280

發布時間:2025-02-08

記者署名:王宏仁

原文內容:

OpenAI去年發表了新一代推理模型o1之後,讓眾人看到GAI開始媲美真人博士或軟體開發高手般的解題能力,掀起了新一輪的大型語言模型競賽。春節期間,以開放權重釋出的DeepSeek R1模型,大幅降低了這一波推理模型競賽的門檻,成了全球AI產業的熱門焦點,開始浮現客製化推理模型的趨勢。

臺灣也有三位AI專家,在2月7日發起了一項臺灣製造大型語言模型計畫,專案代號「自由鋼普拉」(FreedomGunpla R1),希望募資3千萬元,預計在3月底釋出第一版預覽的推理模型。

這款引起全球AI圈熱議的DeepSeek R1模型,在論文中揭露了多項媲美甚至超越OpenAI o1推理模型的能力,因為可以部署到本地端,來避免企業自己的機敏資料上傳到網路,而引起AI圈的重視,不過,R1模型簡體版用戶協議中提到自己通過三項中國AI法規的備案,也讓外界擔心這款模型生成的內容偏重於對齊中國價值。

因此,臺灣有三位不同AI領域的專家,發起了這項重新改造DeepSeek R1,來打造對齊多元價值的繁體中文版推理模型計畫「自由鋼普拉」。這三位發起人,包括了AI PM助理新創MeetAndy AI創辦人薛良斌,Taiwan LLM開發者林彥廷以及雲端遊戲軟體開發供應商Ubitus的執行長郭榮昌。

薛良斌是台灣生成式AI年會主辦人,也是知名售票平臺KKTIX和MLOps新創InfuseAI的共同創辦人,由他來負責募集這項模型改造計畫的資源。

林彥廷則是具有中文大型語言模型訓練經驗的專家,他剛結束了在Meta的實習,參與了Meta訓練Llama模型的過程。林彥廷將負責FreedomGunpla R1的模型訓練工作。而最後一位郭榮昌則擁有大規模GPU叢集管理經驗,旗下公司曾獲得Nvidia破億元投資,也擁有亞洲最大的GPU農場。郭榮昌將負責算力架構和管理。

臺灣目前也有幾款繁中版大型語言模型,主要以Meta釋出的Llama模型為基礎來客製訓練,但薛良斌認為,Llama 3模型不夠聰明,甚至用以「太笨了」來形容,他指出,如果想要打造出自主能力的AI代理,使用媲美O1等級推理能力的模型是最低標準。

這項計畫的技術重點包括了,將以DeepSeek R1為基礎來進行改造,透過重新訓練模型的方式,並以開源授權釋出模型權重,也就是採取開放權重的策略釋出,最後還會打造新的模型身份與品牌。薛良斌強調,這不只是一個技術專案,更是一項文化工程,因為這是一項多元價值觀的對齊任務。

預計分三階段來實現目標,第一階段先對齊西方價值觀,可能導致模型推理能力下滑,薛良斌評估,很高機率達成這個里程碑。第二階段再進一步讓變笨的模型變得聰明,這部分則需要投入更多資源來驗證。這項計畫的終極目標是,不論使用者用繁體中文或是英文時,這款模型的表現可以比使用簡體中文更好。

這項計畫希望募資3千萬元,將由財團法人開放文化基金會(OCF)處理募資,專款專用,透過這筆資金,希望至少可以訓練兩次模型。在時程上,初步預計2025年3月底前釋出第一版預覽模型,開始搜集早期測試者的意見回饋後快速迭代,再釋出最終的版本。

心得/評論:

有料有料
台灣軟體界的大前輩出來號召要用中文資料改進 Deepseek
這樣就對了
比起開源社群那些意識形態掛帥
Deepseek剛出來在那邊喊偷資料、繞過天安門好棒棒

台灣純軟圈大佬出來喊
那些就乖乖閉嘴了XD

可以正視 Deepseek 的實力
借力使力才是真的

開發團隊陣容也相當OK
期待成果

AI PM助理新創MeetAndy AI創辦人薛良斌
Taiwan LLM開發者林彥廷
雲端遊戲軟體開發供應商Ubitus的執行長郭榮昌(由NVIDIA投資)

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.57.249 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1739168485.A.1D9.html
h01036611樓沒問題吧,開源本來就是給你自己玩 02/10 14:22
原文:
freshman2樓怎麼可以依賴中國?!我們要自立自強啊! 02/10 14:22
fbiciamib1233樓真香.jpg 02/10 14:23
raymonde4樓中共同路人 02/10 14:23
orz8110175樓推推 中共同路人站出來 02/10 14:24
ethan04196樓有資源都可以玩啊 02/10 14:24
fhjqwefs7樓抄台灣凸面的對岸政府是不是都是台獨同路人 白O 02/10 14:24
fhjqwefs8樓圖面 02/10 14:24
shaun8510259樓小心等等就要被出征了 02/10 14:25
diefishfish10樓聽都沒聽過的AI專家 02/10 14:25
kapiobhee11樓感覺會被出征 02/10 14:25
diefishfish12樓有國際知名度嗎? 02/10 14:25
Lhmstu13樓完了要被吊路燈了 02/10 14:25
uller14樓募資白嫖 台灣人真好騙 02/10 14:25
glen15樓青鳥怎麼不快出征啊 用對岸的東西還敢募資(咦?) 02/10 14:25
y80012215516樓所以就是用簡中會變笨的模型嘛 防偷神器XDDD 02/10 14:26
wonlylove17樓再套一件衣服就有3000萬 02/10 14:26
sing6090518樓專家?有比鳥群懂嗎 02/10 14:26
raymonde19樓難怪賴皇300億預算可以搞ai 原來是要當中共同路人 02/10 14:26
aixiiae200520樓現在打者民主自由的標語我都會怕... 02/10 14:26
beariscut21樓這三位有脆鳥跟點麵線部長懂AI嗎? 02/10 14:26
josephpu22樓很好啊 開源的用爆就對了 02/10 14:27
DAEVA23樓數發部震怒 02/10 14:27
fashsboy24樓專案名稱中二到有剩 02/10 14:27
CCH202225樓台灣真的要加緊腳步了。AI基礎建設硬體供應鍊在台 02/10 14:27
CCH202226樓灣已經是很大的優勢,軟體方面則尚未成火候,硬體 02/10 14:27
guagua110127樓還要募資 真可憐…… 02/10 14:27
CCH202228樓主要是企業自己拼的。政府要多重視軟體這一塊。 02/10 14:27
knives29樓不就拿人家開源下去改,然後說是原創的,要花幾百E 02/10 14:27
squeakywheel30樓哈哈哈 股版的反中假專家還唱衰DS那麼久 02/10 14:27
更多新聞
[新聞] 法國版「星際之門」來了!馬克宏宣布 AI
[新聞] 仁寶成功雪恥入列「輝達 GTC 大會」 網驚
[新聞] 日本大型航空公司 JAL・ANA 的股東優待
[新聞] 台積電季配息「5元時代」將來臨?140萬
[新聞] 葛來儀:川普打關稅牌 盼台積電承諾對美更多
[新聞] 美欠債可能比想像少?川普暗示馬斯克發現
[新聞] 西洋棋大戰!DeepSeek靠「這招」打贏Chat
[新聞] 川普課稅喚醒鋼鐵人 大國鋼衝漲停