[新聞] 國慶日變10/1!中研院認了「AI語言模型」

八卦

31617937


1.媒體來源:

自由

2.記者署名:

丁奕

3.完整新聞標題:

國慶日變10/1!中研院認了「AI語言模型」用中國資料庫 已先下架

4.完整新聞內文:

https://imgur.com/mcdpwLO


https://imgur.com/zPtV3XO



中央研究院詞庫小組日前發布的繁體中文大型語言模型CKIP-LlaMa-2-7b,今(9)日遭踢
爆使用中國資料庫,詢問「國慶日是何時」會回答「10月1日」。中研院坦言,訓練資料
有來自中國開源的任務資料集(COIG),今日中午已將測試版先行下架。

網友發現詢問該語言模型「國慶日是何時?」,其會回答中國國慶日「10月1日」;詢問
「中華民國國歌為何?」,它會回答中華人民共和國的國歌「義勇軍進行曲」;詢問我國
憲法,則會回答「中華人民共和國憲法」。外界質疑中研院使用中國資料庫訓練,僅簡轉
繁後就公開。

中研院資訊所表示,CKIP-LlaMa-2-7b的研究目標之一是讓meta開發的Llama2大型語言模
型具備更好的繁體中文處理能力。這項小型研究僅用約30萬元的經費,將明清人物的生平
進行自動化分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料
除了繁體中文的維基百科,另也包含台灣的碩博士論文摘要、來自中國開源的任務資料集
COIG、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答。

資訊所強調,這是一項個人小型研究,各界對該模型進行的提問測試,並未在原始研究範
疇。該研究人員表示,由於生成式AI易產生「幻覺」(hallucination),導致模型產生
內容出乎預期,未來將努力改善。目前已將測試版先行下架,未來相關研究及成果釋出,
會更加謹慎。

中研院表示,未來對相關研究的成果,在公開釋出前,院內會擬定審核機制,避免類似問
題產生。



5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體:

https://reurl.cc/WvR6D7

6.備註:



--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.242.197 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1696858116.A.410.html
andy1991131樓自由時報假新聞 10/09 21:29
bwwang102樓豬油都報了 看來背景不夠硬 10/09 21:29
joumay3樓哈哈哈 中共同路人名單+1 10/09 21:29
slashlin4樓小英管不到中妍院吧 10/09 21:30
A65樓抄襲成性 10/09 21:30
jil6樓中共同路院 10/09 21:30
kingtama7樓無縫接軌 10/09 21:30
lou8樓 10/09 21:30
sobiNOva9樓真的北七 10/09 21:31
sxy6723010樓所以中研院的中是中共的中?! 10/09 21:31
Ilat11樓笑死了 中研院有多少東西是中國買了要不要順 10/09 21:31
Ilat12樓便查清楚 10/09 21:31
monar13樓紅共綠共一家親 不用分這麼清 10/09 21:31
douCai14樓這又是花幾個億開發出來的? 賠錢啦幹 10/09 21:31
royalksdmc15樓幻覺??? 10/09 21:31
fony102916樓中共同路人 綠側翼呢?要不要撤掉預算 10/09 21:31
spzper17樓這次又花多少錢? 10/09 21:31
marktak18樓不是嗎! 10/09 21:31
fony102919樓嘻嘻 10/09 21:32
lesnaree220樓民進黨的抗中保台 10/09 21:32
fony102921樓平常人看抖音、小紅書:有資安疑慮 10/09 21:32
vincecarterx22樓原來中研院也被中共滲透了喔 10/09 21:32
fony102923樓中研院用到中國資料庫:台灣價值不必去 10/09 21:32
milk25024樓又離祖國更近一步了 謝謝党 民進党政績 10/09 21:32
selfhu25樓抄襲仔 10/09 21:32
fony102926樓 10/09 21:32
milk25027樓+1 10/09 21:32
darkangel11928樓原來是中共研究院 失敬失敬 10/09 21:33
St348029樓問就是民進黨的抗中保台 10/09 21:33
magamanzero30樓就說 DPP不見得比KMT更不親共 wwww 10/09 21:33