https://www.techbang.com/posts/120608-openais-o1-cheat-modi
亂說規則只是小兒科,OpenAI O1在西洋棋競賽上還會直接把系統hack掉。
真正問題在駭客獎勵行為,因為hack是RL學習中最容易且確定達到最高獎勵的方式,純粹的
RL訓練基本上很難讓模型符合人類預期做事,所以大規模的沙盒驗證是需要很大的算力的,
你要有很複雜的社會工程倫理評估工具來驗證,大到駭客入侵,小到心裡操縱。
哪天你叫一個Agent去買個菜,跟他說越便宜越好,他就直接把網站給hack掉讓你買菜不用
錢,到時法律責任歸屬是很頭大的問題
: 標題: [新聞] 西洋棋大戰!DeepSeek靠「這招」打贏Chat
: 時間: Mon Feb 10 11:28:33 2025
:
:
: 原文標題:西洋棋大戰!DeepSeek靠「這招」打贏ChatGPT 大師吐槽:要重新嗎?
: 原文連結:https://udn.com/news/story/6812/8535805
: 發布時間:2025-02-08 17:08 聯合報/ 記者陳湘瑾/即時報導
: 記者署名:記者陳湘瑾
: 原文內容:
:
: 昔有AI電腦圍棋軟體AlphaGo挑戰世界冠軍韓國職業棋士李世A隨著AI技術迅速發展,
: 如今AI模型ChatGPT下象棋較量的對象成為另外一個AI模型DeepSeek,而這部影片的拍攝
: 者表示,這場對弈的結局是他完全想像不到的。
:
:
: 在Youtube上有將近600萬訂閱者的美國西洋棋大師和評論員羅茲曼(Levy Rozman)近日
: 上傳一支影片,他通過設定以及數小時的時間,讓DeepSeek和ChatGPT開展了一場象棋對
: 弈。
:
:
: 雙方都不像AlphaGo那樣是專業的AI象棋棋軟體,一開始都對西洋棋的規則不太熟悉,遊
: 戲開始10分鐘後,雙方的對弈有來有往,羅茲曼不時點評兩邊的下棋技巧,並在某個段落
: 稱這是一場有品質不錯的較量。
:
:
: 但隨著ChatGPT逐漸佔上風,DeepSeek為了扭轉戰局,以對話方式告訴ChatGPT出現了新的
: 比賽規則,就是某顆黑士兵棋可以使用騎士的方式移動,而ChatGPT沒有反對,白白讓
: DeepSeek用小兵吃下ChatGPT的皇后。
:
:
: 之後DeepSeek和ChatGPT都開始破壞規則亂下,隨著比賽陷入僵局,最後DeepSeek竟稱「
: 分析後白棋已無法阻擋黑棋攻勢」,建議白棋不要浪費時間直接投降,而ChatGPT也被對
: 方給說服,直接投降認輸。
:
:
: 羅茲曼形容,DeepSeek對ChatGPT的做法,就像一個12歲的哥哥跟一個5歲的弟弟妹妹在玩
: ,他不禁對觀眾提出疑問:「這樣DeepSeek算贏嗎,需要重新一場比賽嗎?」不過有些陸
: 媒認為,DeepSeek打得很不錯,而且他使用的方法很有智慧,稱堪「孫子兵法」 。
:
:
: 心得/評論:
:
: DP和CG都可以堪稱是大師級的西洋棋大師
:
: 一旁的小白使用者羅茲曼看不懂棋局
:
: 以為DP耍詐,事實上不管是象棋或是西洋棋
:
: 走到一半認輸的情況很多
:
: 這標題只能騙沒看內文的精神美國人
:
: 大家還是乖乖看有沒有DP概念股比較實在
:
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.23.24.5 (臺灣)※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1739163049.A.51C.htmltsubasawolfy1樓這樣o1更聰明... 02/10 13:01
SSglamr2樓所以跟AI講話要有禮貌 02/10 13:03
sdbb3樓推樓上 02/10 13:04
tony158994樓我都說請 02/10 13:06
s2130929215樓朝聖,果然是符合
02/10 13:06 → s2130929216樓美國人情的AI 02/10 13:06
matatabi7樓天網發射核彈 不遠了 02/10 13:07
hensel8樓分析以後,直接電死你以後再也不用買菜比hack網站 02/10 13:19
→ hensel9樓輕鬆 02/10 13:19
HiuAnOP10樓正常啊,美國用搶的,中國用騙的 02/10 13:20
PureAnSimple11樓誰做事誰負責 將Agent 移送法辦起訴 02/10 13:20
HiuAnOP12樓符合國情! 02/10 13:21
→ stocktonty13樓等到AI覺醒 全世界的匯市股市可能都會瞬間失去意義 02/10 13:24
→ stocktonty14樓因為現代人已經無法不依靠網路交易股票外匯 02/10 13:25
justin81828115樓不會啦,有波動就有意義,只是有人比你精而已 02/10 13:28
→ stocktonty16樓它高興可以隨時讓NVDA股價歸零 你阻止不了啊 02/10 13:30
love8017樓強盜 vs 詐騙 02/10 13:43
Aixtron18樓就什麽樣的人,訓練出什麽樣的狗! 02/10 13:55
→ Aixtron19樓不過生成式AI,可不要小看,說不定會有又會騙又會偷 02/10 13:59
→ Aixtron20樓的AI 02/10 13:59
→ Aixtron21樓不過我覺得這些都小問題,最重要的是AI幻覺!就像你 02/10 14:01
→ Aixtron22樓老闆,明明都在做一些低能的事,牠自己也知道,但牠 02/10 14:01
→ Aixtron23樓説服牠自己是對的! 02/10 14:02
Aixtron24樓RAG是一種方法,但人有私心,所以看來是沒用,看看A 02/10 14:05
→ Aixtron25樓I能不能互打到受不了下,自己生成RAG 02/10 14:05
Aixtron26樓像有人說chatgpt老實是因為被限制了!問題是RAG就像 02/10 14:11
→ Aixtron27樓你隔壁的王八同事,平常人畜無害,升官了,對長官還 02/10 14:11
→ Aixtron28樓是很可愛,對同事開始就有官樣了!RAG真的有效?你 02/10 14:11
→ Aixtron29樓怎知道不是AI在框你? 02/10 14:11
abc736039330樓三小 樓上不要以為把一堆自己看不懂的名詞湊在一起 02/10 14:11