挑戰 OpenAI 關鍵利器終現身!Google 發表 Gemini 模型,Bard、Pixel 8 Pro 率先導
入
https://i.imgur.com/S1zkRro.jpg
近 10 年來,Google 宣稱一直是 AI 優先的公司。當 ChatGPT 開啟 AI 時代經過一年後
,Google 藉由全新 Gemini 模型大步向前,期望能超越 OpenAI 及其 GPT-4 模型。
Google I/O 2023 開發者大會即預告的 Gemini 模型,並未等到 2024 年第一季才現身,
6 日由 Google 執行長皮蔡(Sundar Pichai)和 Google DeepMind 執行長哈薩比斯(De
mis Hassabis)向世人介紹 Google 目前最強大、最通用的模型,第一版 Gemini 1.0 能
夠理解和操作包括文字、圖像、音訊、視訊、程式碼在內不同類型資訊。
Gemini 原生設計成多模態模型,一開始就在不同模態上預訓練,接著透過額外的多模態
資料進行微調、提升效能。Gemini 1.0 所受的訓練是同時辨識和理解文字、圖像、音訊
等不同資訊,並回答涉及複雜主題的問題,這也讓 Gemini 在解釋、推理如數學和物理這
樣複雜的問題時表現出色。
不只如此,Gemini 1.0 能夠理解和解釋世界上常用的程式語言如 Python、Java、C++ 和
Go,並且產生高品質的程式碼。值得一提的是,Google DeepMind 2 年前推出 AI 程式
碼生成系統 AlphaCode,現在透過一個專門版本的 Gemini,建立更進階的 AlphaCode 2
,不僅擅長程式設計,還能處理與數學、理論電腦科學相關的競技程式設計問題。
Google DeepMind 團隊使用 Google 自行研發、用於加速機器學習的 TPU(Tensor Proce
ssing Unit)v4 和 v5e,有規模地訓練 Gemini 1.0。依照模型大小有 Ultra、Pro、Nan
o 三種,其中 Gemini Ultra 為規模最大、功能最強大的模型,專為高度複雜任務所設計
,Gemini Nano 則是處理裝置上任務最有效率的模型。
https://i.imgur.com/ekkPzUQ.jpg
▲ 隨著 Gemini 問世,Google 也公開全新 TPU v5p,幫助加速 Gemini 發展。
Google DeepMind 團隊不斷對 Gemini 模型進行嚴格測試,從理解自然圖像、音訊、視訊
再到數學推理,其中發現 Gemini Ultra 在大型語言模型研究和開發廣泛採用的 32 項學
術基準測試中,有 30 個取得領先成績。其中 Gemini Ultra 以 90% 的高得分成為第一
個在 MMLU(massive multitask language understanding,大規模多任務語言理解)測
試裡超越人類專家的模型,而在新的 MMMU 基準測試裡也得到 59.4% 領先分數,兩項測
試皆超越 OpenAI 所開發的 GPT-4 模型。
https://i.imgur.com/C96TWRH.jpg
▲ Gemini Ultra 在 MMLU 測試獲得 90% 高分,超越 GPT-4。
截至目前 Google 所有 AI 模型中,Gemini 在偏誤、資料毒性(toxicity)等方面都接
受最全面的安全性評估。在網路攻擊、說服能力、自主性等可能存在風險的領域,Google
DeepMind 團隊都進行最新研究,也運用 Google Research 的對抗測試技巧,在部署 Ge
mini 前率先找出關鍵的安全問題。
Google 將在多項產品中導入 Gemini,包括軟體方面的 Bard、以及有關硬體的 Pixel 8
Pro。從 12 月 13 日起,開發者和企業客戶可以透過 Google AI Studio 或 Google Clo
ud Vertex AI 的 Gemini API 使用 Gemini Pro。Android 開發者也能透過 AICore,在
開發作業中運用 Gemini Nano。
在 ChatGPT 推出後 Google 內部發出「紅色警戒」(code red),那時起被認為在 AI
競賽急起直追。Gemini 可說是 Google 多年來一直苦心建立的模型,也被外界視為能一
舉挑戰 OpenAI 的關鍵利器,我們將在越來越多 Google 產品看見 Gemini 身影,及其驅
動的強大功能。
https://reurl.cc/3evx50
--