原文標題:不是用輝達GPU!蘋果揭露靠Google自研晶片訓練AI模型
原文連結:https://udn.com/news/story/6811/8127425
發布時間:2024-07-30 09:26
記者署名:葉亭均
原文內容:
蘋果公司周一(29日)表示,支撐其AI系統Apple Intelligence的人工智慧模型是靠
Google設計的處理器進行預先訓練。這顯示蘋果並非是使用輝達(Nvidia)的晶片來訓練
AI模型,也是大型科技公司在訓練先進AI方面尋求輝達晶片以外替代品的一個跡象。
蘋果發表一篇技術報告,詳述選擇採用Goolge開發的兩種TPU(Tensor Processing Unit
,張量處理器)進行AI模型訓練,這些處理器構成了大型晶片叢集。為了建立在iPhone和
其他裝置上運作的AI模型,蘋果使用了2,048個TPUv5p晶片;在伺服器AI模型中,蘋果部
署8,192個TPUv4處理器。
蘋果決定採用Google的雲端基礎設施來訓練AI模型,是值得注意的,因為輝達所生產的AI
處理器是目前業界最熱門的。包含計算Google、亞馬遜和其他雲端運算公司生產的晶片在
內,輝達占了大約80%市占。
在研究報告中,蘋果沒有表明未使用輝達晶片,但在描述其AI工具的硬體和軟體基礎與功
能時,並沒有提到輝達的軟體。
路透說,無法立即連絡到蘋果公司提出回應。Google沒有回覆置評請求,輝達則不願置評
。
輝達並不設計TPU,而是聚焦廣泛用於AI的繪圖處理器(GPU)。
Google是透過其雲端平台Google Cloud Platform銷售能使用其TPU的權利,這點和輝達獨
立銷售晶片與系統的做法不同。有意購買TPU使用權的客戶,必須透過Google的雲端平台
構建軟體,才能使用TPU。
蘋果在47頁的報告中沒有提到Google或輝達,但確實指出其蘋果基礎模型(AFM)和AFM伺
服器是在「雲端 TPU叢集」上進行訓練。這代表蘋果是向雲端業者租用伺服器來執行運算
。
蘋果工程師在研究報告中表示,使用Google的晶片可以創造出比報告中討論的兩款模型更
龐大、更複雜的模型,「這系統讓我們能夠有效率地訓練AFM模型而且可以擴容,包括終
端裝置上的AFM、AFM伺服器與更大的模型。」
蘋果本周將向其測試版用戶推出Apple Intelligence功能。
蘋果在6月的開發者大會上發表一系列新的AI功能,包括將OpenAI的ChatGPT技術整合到其
軟體中。
心得/評論:
蘋果不跟 NVDA 玩,直接跟 Google 組隊
但蘋果到底要訓練什麼東西? 不是把 chatGPT 包一包嗎?
不論怎樣,我買不起麥當勞,也會買 AI 手機
讓 AI Great Agagin! 下半年 AI 股再漲一倍
--