Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高

股票

49302

目前就在旁邊吃瓜觀望@@ 成本這種本就是用開源後的可以拿已有的模型去當輔助下降成本

最常見作法就是拿gpt-4o當judge或者當數據產生器去精煉數據集如果再沒有gpt-4o
情況下很多高質量資料去產生就花很錢最經點例子就是LLaVa 一個博士班學生用gpt-4o
去產生高質量多模態數158k 極小量數據集用8xA100 1天時間就幹爆之前所有
多模態大模型能打贏saleforce的一間大公司堆出來的多模態BLIP-2模型
這傢伙精髓站就是在gpt-4模型巨人的肩膀上

資料的quality會影響大模型而資料可以透過開源高質量模型去萃取
如果再套用COT 這些都可以繼續進化 paper有些細節像是數據集這類如何精煉
反而可能會是一個重要一環但大家都會藏這類細節 @@/

2025現在大家都殺到LLM Agent去了 LLM刷模型任務分數熱潮有點下降
大部分都跑去搞LLM決策部分和COT (思考鏈) 多步驟分析任務
像是waymo自駕端對端的決策都搞了一個EMMA 用Gemini 去往上蓋
(這時候自駕公司有自己的很強的LLM就很有用了隨手不負責預測亞麻zoox會拿自家
LLM或anthropic來搞end-2-end多模態)

然後LLM Agent如果要放在機器人和自駕
一定得on-device 因為雲端延遲太慢風險高所以1B~4B這陣子的on-device模型
能力也在不斷突破所以on-device LLM不太會在是AI-PC 除非是屬於私密資料等應用場景
而edge/on-devcie AI 可能突破點會在機器人

自駕的趨勢之後會跟LLM走上同陣線在某個時間點等閉源LLM開始時就是差不多AI模型
的盡頭開始產業化也許端對端LLM決策可以強化視覺上標籤數據不足 (不確定這點
但直覺上認為思考練LLM Agent可以降低場景車用數據量..QQ 基於模型泛化能力)
這會給其他車廠追上特斯拉的機會特斯拉自身的LLM可來自grok 而3D基礎模型
foundation model 像是李飛飛的空間模型有一定機會能幫助自駕可以直接融合LLM
產生端對端多模態而李飛飛又跟狗家走很近所以想單賭個股可以賭賭看狗家

--
順帶一提 LLM Agent在寫code部分越來越噁心了強烈建議不要去當碼農..QQ
機器人題材就是跟LLM Agent有關只要注意誰能做LLM Agent軟硬體部分就好

狗家的現在佈局就是拿Gemini去瘋狂蓋各種下游任務: 自駕 AR眼鏡搜尋多模態
語音翻譯 Youtube 廣告消費地圖商家產品這些多樣性因為自家公司的資料特殊性
現在有點佔上風

股點就是買Big 7 + 台積 @@/

: 剛剛看FB，發現有個中國的作家對於Deepseek的作文水平感到驚訝，用了相同問題，以王家
: 衛的電影風格去撰寫標題為人生何處不相逢的散文，來分別問CHATGPT-O1跟Deepseek-R1
: ChatGPT-O1:
: https://i.imgur.com/T2jN9hZ.jpeg

: Deepseek-R1:
: https://i.imgur.com/IitIbR0.jpeg

: 我是覺得Deepseek的回答好像有點純堆砌王家衛的電影名台詞的感覺，通篇王家衛感，但是
: 不知道在說甚麼
: ChatGPT 在最後有點出散文標題，內容也比較有切合標題
: 這應該可以當作兩者的能力小比拼吧？
: --------
: 補：
: 我也有用4O用相同問題問過，我覺得寫得比O1跟R1還好
: https://i.imgur.com/7DN4Dz9.jpeg

: 這滿神奇的，O1應該是ChatGPT 最強的模型，但是寫散文我覺得沒有4O寫得好
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 125.228.63.38 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737868561.A.963.html

sdbb1樓99nvdl 01/26 13:21

→ sdbb2樓Btw，GooG tsm，which better? 01/26 13:23

→ sdbb3樓GG VS. 積積 01/26 13:24

感覺都可以賭啊狗家可以問TQQQ王 TSM還得看川普的心情吧@@?

jack12184樓請問現在有甚麼好用的寫code用的LLM agent呀 01/26 13:35

REDDIT.COM

Reddit - Dive into anything

→ banque5樓現在Big 7中幾個增加一堆資本支出建數據中心 01/26 13:38

→ banque6樓還沒找到具體的應用回收成本的方法 01/26 13:38

→ banque7樓就面臨超便宜還開源的模型競爭 01/26 13:38

→ banque8樓這消息很難解讀成繼續投資Big 7的利好吧 01/26 13:38

QQ BIG5會用裁員降數據中心成本(扣掉老黃果家) 所以帳面上還是很好看據說接下來一個月內麻家軟家會開始砍人阿祖是用intense of year 來捲走人力

→ Altair9樓1128寫程式不再是金飯碗美國軟體工程師職缺5年腰斬 01/26 13:39

allen051910樓這篇講的最專業給推!! 同樣的問題問chatgpt跟gemin 01/26 13:44

→ allen051911樓i雖然答案整體差異不大但格式跟思路並不同問deeps 01/26 13:44

→ allen051912樓eek有種熟悉感特別像chatgpt 或許真的被拿來當教練 01/26 13:44

→ junior02048613樓FANNG+,TSM無腦多 01/26 13:46

tsukirit14樓Big7個屁，誰要買垃圾貧果 01/26 13:47

lpmybig15樓Fanng gogogo 01/26 13:49

Roger556616樓既然AIPC沒有市場蘋果前途黯淡可以空了 01/26 13:49

GinginDenSha17樓推專業 01/26 13:57

create818樓碼農失業潮，幹 01/26 14:12

kanx19樓也要記得買HBM, 現代美光三星? 01/26 14:14

CorkiN20樓個人的看法雖然消費者端是一部份目標但現階段對巨 01/26 14:23

→ CorkiN21樓頭們來說AI是因為能增加”生產力/人”才瘋狂投資 01/26 14:23

→ CorkiN22樓投入AI基建生產力++人力需求— 01/26 14:23

→ CorkiN23樓巨頭並沒有沒回收成本是已經在回收成本 01/26 14:23

→ CorkiN24樓巨頭內部已經在用AI降低自己的生產成本 01/26 14:25

littenVenus25樓tsm只要來個大地震就崩惹=.= 01/26 14:27

→ CorkiN26樓這兩三年巨頭們裁員的消息不斷但營收還是持續向上 01/26 14:27

→ CorkiN27樓那不就也證明投入AI基建生產力已經在增加了嗎 01/26 14:27

→ littenVenus28樓窩長官們前幾天還說今年只要壓雞雞就能躺著賺什麼 01/26 14:28

→ littenVenus29樓都不用做 01/26 14:28

→ CorkiN30樓倒是NV這幾年都在擴張台灣辦公室一直招人真的猛 01/26 14:28

PTT鄉民日記

Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高

股票