Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預

股票

19100


很多人看著benchmark多高多高吹滿天
如果你也是個老電腦玩家
就知道評測基本只能當參考

老黃前陣子在大會上拿出新的遊戲顯卡5070說對標4090
新玩家們個個目瞪口呆
老玩家們則是
https://i.imgur.com/Sxb1f15.jpeg


評測數據嚇死人
實跑遊戲笑死人
然後再來怪優化不佳
這種我們中老年都看多了
講那摸多
不用不用
實際動手玩
就知道惹

反正大過年的
閒著也是閒著
就來實地評測AI

也不用拿什麼多複雜難解的數學題
就拿前端碼農拿到設計圖要切版就好
最實際在工作上會用到

https://i.imgur.com/sLl860H.jpeg

這是網路上找到的一個簡單的註冊網頁設計圖
目標是把圖丟給AI
叫它照著圖寫程式
然後要有基本的驗證輸入欄位功能
像是你email沒填
或是密碼格式不對要檢查之類的

我的提示詞如下:

使用html css javascript網頁前端技術
請完全依照設計圖
製作一個註冊頁面
網頁裡各項欄位必須在驗證是否留空
密碼欄位需驗證是否至少含有一個大寫字母及一個特殊符號
驗證未通過在欄位右方加入提示方塊

接著各家AI產出的結果如下:

Gemini 2.0 Flash Thinking Experimental
https://thelonesomeera.com/signuptest/gemini/

ChatGPT o1
https://thelonesomeera.com/signuptest/chatgpt/

Claude 3 Haiku
https://thelonesomeera.com/signuptest/claude/

DeepSeek R1
https://thelonesomeera.com/signuptest/deepseek/

大家可以自己進去玩一玩比較一下
這些都是AI產出的我一行程式碼都沒有改完全複製貼上
然後也沒有串接後端程式和資料庫所以你真的點Sign Up也不會紀錄任何資料
懂程式的可以自己右鍵檢查看code或直接下載回去研究

結論是我想我還是繼續用ChatGPT好了
Gemini那個新模型四天前剛出
總算是有進步了
然後皮皮鬼也有去給川皇下跪
GOOG現在可以考慮進場...吧?

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.169.31.248 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737797852.A.48C.html
MoonCode1樓你倒是講一下差異 01/25 17:44
itwt2樓差異自己測一下就知道吧... 01/25 17:46
iaminnocent3樓CHATGPT 跟Claude是真的有規則的,沒有達成規則會 01/25 17:52
iaminnocent4樓跳出提示,Chatgpt填寫完成還有註冊成功訊息XD 01/25 17:52
iaminnocent5樓deepseek的R1我剛剛也有跟ChatGPT o1進行同問題測 01/25 17:54
iaminnocent6樓試,在路徑規劃問題上O1推理得到正確路徑,R1則是 01/25 17:54
iaminnocent7樓完全錯誤,另外毒藥問題上也是O1回答比R1好 01/25 17:54
Lenon45618樓聽君一席話 如聽 01/25 18:10
silveriii9樓Claude Sonnet比較強 Haiku是來聊天的 01/25 18:46
karcher10樓Gemini連切版都會,感覺web前端快失業 01/25 19:34
karcher11樓看來要找工程師直接找全端了 01/25 19:37
INIKS12樓功能普通,不支援圖形語音,這種文字模型不是到處都 01/25 20:16
INIKS13樓是嗎? 01/25 20:16
INIKS14樓一看價格.....真香! 01/25 20:16
INIKS15樓 01/25 20:30
newyorker5416樓你不要這麼專業好不好,中吹會崩潰 01/25 20:38
ohha022117樓但價錢差很大 一分錢一分貨 XD 01/25 21:02
ActionII18樓這個就是對岸擅長的啊,雖然你的比較好,但我的巨 01/25 21:16
ActionII19樓便宜 01/25 21:16
ActionII20樓這種東西落地就是要看成本,這東西只有一半好用但 01/25 21:18
ActionII21樓成本差了幾個數量級 01/25 21:18
ActionII22樓那些meta 的人恐懼的不就是這樣嗎 01/25 21:19
ImHoluCan23樓小米蘇7是保時捷沒錯 01/25 21:28
yumumu24樓推,不過你Claude怎麼拿Haiku,應該拿Sonnet吧 01/25 21:35
它說現在流量太高免費仔暫時停用 等開放再測一次
TaiwanUp25樓一拳超人 美中的差距就在這裡 01/25 22:12
ken8526樓飛彈很精準好用 但是決定戰場的是便宜的無人機吧~~ 01/25 22:21
doubi27樓Claude 寫程式一定要選 Sonnet, 真心不騙 01/25 23:46
doubi28樓成功率比 ChatGPT 好很多 01/25 23:47
doubi29樓Deepseek 的 Code 我沒有一次採用 ... 01/25 23:47
doubi30樓但是文書處理 DeepSeek 蠻好用的 01/25 23:47