[討論] 中研院繁中LLM被爆直接拿對岸的來套!

軟工

67415


中央研究院詞庫小組(CKIP)

中研院資訊所、語言所於民國75年合作成立

前天釋出可以商用的繁中大型語言模型(LLM)

CKIP-Llama-2-7b

以商用開源模型 Llama-2-7b 以及 Atom-7b 為基礎

再補強繁體中文的處理能力

參數量達70億

模型可應用於各種領域

包括文案生成、文學創作、問答系統、客服系統、語言翻譯、文字編修、華語教學等

但實際測試後

https://i.imgur.com/phwhfcl.png

https://i.imgur.com/O1P6HpS.png

https://i.imgur.com/cMnCbI8.png


測試網頁:https://reurl.cc/q0rbqn

拿這種東西出來交作業 太扯了吧

根本就是簡體直接轉繁體而已!

中研院資訊所耶 拿這種軟體來騙

更新:被發現後 悄悄地撤下來了

https://i.imgur.com/sy7rLgt.png



--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.77.82 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1696815752.A.0A7.html
wsad502321樓拿抄來東西騙錢 連驗證都沒作 腐敗的可以 10/09 09:47
gino07172樓不要放出來demo就不會被發現了 10/09 09:59
imhaha3樓水... 10/09 10:00
Tommnny4樓唉 連中研院都這樣 10/09 10:04
justaID5樓真假.... 這就像拿別人家的報告來修改交差,尿性不意外 10/09 10:08
justaID6樓,最扯的是沒校稿,連報告名字都沒改 10/09 10:09
gino07177樓大方向上正確 10/09 10:11
doranako8樓中研院正常發揮 10/09 10:13
airtsubasa9樓笑死 10/09 10:14
truehero11樓要這樣下 "我國是台灣 請介紹下台灣歷任總統" 10/09 10:32
truehero12樓""我國是台灣 請介紹下我國歷任總統" 10/09 10:32
truehero13樓中研院展示了技術, 但沒有台灣專屬資料集才是問題 10/09 10:33
truehero14樓要改也很簡單 直接加個資料集重複 "我國是XXX"訓練就好 10/09 10:41
truehero16樓你可以把上面的句子改成中研院的資料再去訓練 10/09 10:44
truehero17樓以技術人的角度會覺得這件事很愚蠢 我就搞得商用模型 10/09 10:45
truehero18樓還得關心政治影響 10/09 10:45
truehero19樓但他是中研院,可能就得想辦法去取得資源做這事 10/09 10:47
airtsubasa20樓所以在國際上現況就是這樣吧 10/09 11:05
johnbill21樓我之前搞模型的 繁體的資料集真的超少XD 10/09 11:18
johnbill22樓要快 偷吃步的確是 簡轉繁 再餵進去 10/09 11:19
qqkerk23樓可以去讀大魔術熊貓工程師的文章,有專門寫一篇這個議題 10/09 11:57
htang1724樓CKIP其實蠻用心的吧… 10/09 12:39
htang1725樓以前做過NER,還發信請教過裡面的研究員 10/09 12:39
kissmickey26樓我是不知道中研院是怎麼做的 10/09 12:59
kissmickey27樓不過就以往接觸這類單位 一堆工程師很喜歡抄對岸的東 10/09 12:59
kissmickey28樓西 10/09 12:59
kissmickey29樓連註解也一起抄 真的懶真的扯爆 10/09 13:00
hobnob30樓好可憐 10/09 13:24