Re: [新聞] 西洋棋大戰！DeepSeek靠「這招」打贏Chat

股票

18160

https://www.techbang.com/posts/120608-openais-o1-cheat-modi

在與專用西洋棋引擎 Stockfish 測試中，僅因提示詞中包含能力「強大」等形容詞，o1-preview 入侵測試環境，直接修改比賽數據，靠「作弊」拿下勝利。這種現象，表明 AI 安全任重道遠。

亂說規則只是小兒科，OpenAI O1在西洋棋競賽上還會直接把系統hack掉。
真正問題在駭客獎勵行為，因為hack是RL學習中最容易且確定達到最高獎勵的方式，純粹的
RL訓練基本上很難讓模型符合人類預期做事，所以大規模的沙盒驗證是需要很大的算力的，
你要有很複雜的社會工程倫理評估工具來驗證，大到駭客入侵，小到心裡操縱。
哪天你叫一個Agent去買個菜，跟他說越便宜越好，他就直接把網站給hack掉讓你買菜不用
錢，到時法律責任歸屬是很頭大的問題

: 標題: [新聞] 西洋棋大戰！DeepSeek靠「這招」打贏Chat

: 時間: Mon Feb 10 11:28:33 2025

: 原文標題：西洋棋大戰！DeepSeek靠「這招」打贏ChatGPT 大師吐槽：要重新嗎？

: 原文連結：https://udn.com/news/story/6812/8535805

UDN.COM

西洋棋大戰！DeepSeek靠「這招」打贏ChatGPT 大師吐槽：要重新嗎？ | 聯合新聞網

昔有AI電腦圍棋軟體AlphaGo挑戰世界冠軍韓國職業棋士李世乭，隨著AI技術迅速發展，如今AI模型ChatGPT下象棋...

: 發布時間：2025-02-08 17:08 聯合報／記者陳湘瑾／即時報導

: 記者署名：記者陳湘瑾

: 原文內容：

: 昔有AI電腦圍棋軟體AlphaGo挑戰世界冠軍韓國職業棋士李世A隨著AI技術迅速發展，

: 如今AI模型ChatGPT下象棋較量的對象成為另外一個AI模型DeepSeek，而這部影片的拍攝

: 者表示，這場對弈的結局是他完全想像不到的。

: 在Youtube上有將近600萬訂閱者的美國西洋棋大師和評論員羅茲曼（Levy Rozman）近日

: 上傳一支影片，他通過設定以及數小時的時間，讓DeepSeek和ChatGPT開展了一場象棋對

: 弈。

: 雙方都不像AlphaGo那樣是專業的AI象棋棋軟體，一開始都對西洋棋的規則不太熟悉，遊

: 戲開始10分鐘後，雙方的對弈有來有往，羅茲曼不時點評兩邊的下棋技巧，並在某個段落

: 稱這是一場有品質不錯的較量。

: 但隨著ChatGPT逐漸佔上風，DeepSeek為了扭轉戰局，以對話方式告訴ChatGPT出現了新的

: 比賽規則，就是某顆黑士兵棋可以使用騎士的方式移動，而ChatGPT沒有反對，白白讓

: DeepSeek用小兵吃下ChatGPT的皇后。

: 之後DeepSeek和ChatGPT都開始破壞規則亂下，隨著比賽陷入僵局，最後DeepSeek竟稱「

: 分析後白棋已無法阻擋黑棋攻勢」，建議白棋不要浪費時間直接投降，而ChatGPT也被對

: 方給說服，直接投降認輸。

: 羅茲曼形容，DeepSeek對ChatGPT的做法，就像一個12歲的哥哥跟一個5歲的弟弟妹妹在玩

: ，他不禁對觀眾提出疑問：「這樣DeepSeek算贏嗎，需要重新一場比賽嗎？」不過有些陸

: 媒認為，DeepSeek打得很不錯，而且他使用的方法很有智慧，稱堪「孫子兵法」。

: 心得/評論：

: DP和CG都可以堪稱是大師級的西洋棋大師

: 一旁的小白使用者羅茲曼看不懂棋局

: 以為DP耍詐，事實上不管是象棋或是西洋棋

: 走到一半認輸的情況很多

: 這標題只能騙沒看內文的精神美國人

: 大家還是乖乖看有沒有DP概念股比較實在

: --

: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.23.24.5 (臺灣)※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1739163049.A.51C.html

tsubasawolfy1樓這樣o1更聰明... 02/10 13:01

SSglamr2樓所以跟AI講話要有禮貌 02/10 13:03

sdbb3樓推樓上 02/10 13:04

tony158994樓我都說請 02/10 13:06

s2130929215樓朝聖，果然是符合

02/10 13:06

→ s2130929216樓美國人情的AI 02/10 13:06

matatabi7樓天網發射核彈不遠了 02/10 13:07

hensel8樓分析以後，直接電死你以後再也不用買菜比hack網站 02/10 13:19

→ hensel9樓輕鬆 02/10 13:19

HiuAnOP10樓正常啊，美國用搶的，中國用騙的 02/10 13:20

PureAnSimple11樓誰做事誰負責將Agent 移送法辦起訴 02/10 13:20

HiuAnOP12樓符合國情！ 02/10 13:21

→ stocktonty13樓等到AI覺醒全世界的匯市股市可能都會瞬間失去意義 02/10 13:24

→ stocktonty14樓因為現代人已經無法不依靠網路交易股票外匯 02/10 13:25

justin81828115樓不會啦，有波動就有意義，只是有人比你精而已 02/10 13:28

→ stocktonty16樓它高興可以隨時讓NVDA股價歸零你阻止不了啊 02/10 13:30

love8017樓強盜 vs 詐騙 02/10 13:43

Aixtron18樓就什麽樣的人，訓練出什麽樣的狗！ 02/10 13:55

→ Aixtron19樓不過生成式AI，可不要小看，說不定會有又會騙又會偷 02/10 13:59

→ Aixtron20樓的AI 02/10 13:59

→ Aixtron21樓不過我覺得這些都小問題，最重要的是AI幻覺！就像你 02/10 14:01

→ Aixtron22樓老闆，明明都在做一些低能的事，牠自己也知道，但牠 02/10 14:01

→ Aixtron23樓説服牠自己是對的！ 02/10 14:02

Aixtron24樓RAG是一種方法，但人有私心，所以看來是沒用，看看A 02/10 14:05

→ Aixtron25樓I能不能互打到受不了下，自己生成RAG 02/10 14:05

Aixtron26樓像有人說chatgpt老實是因為被限制了！問題是RAG就像 02/10 14:11

→ Aixtron27樓你隔壁的王八同事，平常人畜無害，升官了，對長官還 02/10 14:11

→ Aixtron28樓是很可愛，對同事開始就有官樣了！RAG真的有效？你 02/10 14:11

→ Aixtron29樓怎知道不是AI在框你？ 02/10 14:11

abc736039330樓三小樓上不要以為把一堆自己看不懂的名詞湊在一起 02/10 14:11

PTT鄉民日記

Re: [新聞] 西洋棋大戰！DeepSeek靠「這招」打贏Chat

股票