https://www.jiqizhixin.com/articles/2024-05-16-6
機器之心
奧特曼:如果沒有他(Prafulla Dhariwal)的遠見、才華、信念和決心,就不會有
GPT-4o。
「GPT-4o 的誕生離不開@prafdhar 的遠見、才華、信念和長期以來的堅定決心。正是這
些努力(以及許多其他人的工作)促成了我希望會成為電腦使用方式革命的成果。」
在OpenAI 發布新一代旗艦生成模型GPT-4o 後的兩天,OpenAI CEO 奧特曼對參與計畫的
其中一位負責人評論道。
緊隨其後,聯合創始人Greg Brockman 表示:「GPT-4o 是整個團隊努力的結果。特別要
感謝@prafdhar,他堅信能夠建立一個全能模型,並在過去18 個月里通過與OpenAI 的多
個團隊展開合作,從而實現了這一目標。
看到這,估計大家都很好奇,prafdhar 到底是誰,他就是Omni 團隊負責人Prafulla
Dhariwal,也是GPT-3、DALL-E 2 共同創作者。 Dhariwal 表示「GPT-4o(o 代表omni)
是Omni 團隊推出的首個模型,也是OpenAI 首個原生的全多模態模型。這次發布是整個組
織共同努力的結果」。同時,Dhariwal 提到他想特別感謝團隊中一些出色的成員,正是
他們讓這個神奇的模型成為可能!
Dhariwal 口中出色的團隊成員到底有誰,整個團隊貢獻者都有哪些,接下來我們將為大
家一一揭曉。
Prafulla Dhariwal
Prafulla Dhariwal 是OpenAI 的研究科學家(也是前文奧特曼特別感謝的人),研究方
向主要是生成式模型和無監督學習。他在2017 年加入OpenAI,至今已有7 年多的時間。
Prafulla Dhariwal 本科畢業於麻省理工學院。在MIT,Prafulla Dhariwal 主要學習電
腦科學、數學、物理學,並在MIT 大腦、思維和機器中心擔任本科生研究員。
根據Google Scholar 顯示,Dhariwal 論文引用次數達到72200 多次,參與的研究包括
DALL-E 2、DALL-E 3、Glow、Consistency Models 等,都是大家比較熟悉的。
James Betker
James Betker 是OpenAI 的研究工程師,主要研究影像和音訊的生成式建模。
在加入OpenAI 之前,James Betker 在GARMIN 國際航空電瑞士有限公司擔任了12 年的軟
體工程師,並曾在Google擔任軟體工程師。
Rowan Zellers
Rowan Zellers 是OpenAI 的研究員,致力於建構透過語言、視覺和聲音來理解人類和世
界的機器。
Prafulla Dhariwal 表示:「Rowan Zellers 的研究工作讓GPT-4o 能夠像人類一樣自然
地觀看影片。」Rowan Zellers 也是GPT-4 研究團隊成員之一。
Alexis Conneau
Alexis Conneau 現在為OpenAI 音訊AGI 研究負責人。 Dhariwal 表示Conneau 比
OpenAI 的任何人都更早提出了HER 的願景,並堅持不懈地執行!
Gabriel Goh
Gabriel Goh 為OpenAI機器學習研究員,他對可解釋性、機器學習、數據視覺化和凸優化
有興趣。曾經參與了DALL・E 1、DALL・E 3、GPT-4 等的研究。
Ishaan Gulrajani
Ishaan Gulrajani 現在為OpenAI機器學習研究者,此前他博士畢業於史丹佛大學,曾經
參與Alpaca、Stanford alpaca 等的研究。
Alex Nichol
Alex Nichol 在OpenAI 從事深度學習研究,DALL-E 2 共同創造者,擅長程式碼、人工智
慧和3D 列印。
Li JING
Li JING 是OpenAI 的研究員,在GPT-4o 工作中主要進行影像/ 3D 生成的研究。
Li JING 也是DALL・E 3 和Sora 的研究團隊成員。 Li JING 的研究工作致力於幫助人工
智慧理解現實世界並創造新的智慧。
Casey Chu
Casey Chu 是OpenAI 的研究員,研究多模態人工智慧系統,曾參與GPT-4、DALL・E 2 的
研究。此前,他博士畢業於史丹佛大學。
Mark Chen
Mark Chen 為OpenAI 前沿研究主管,5 月14 日凌晨發表會現場就有他的身影,Mark
Chen 曾參與DALL・E、GPT-4 等的研究。
Jiahui Yu
Jiahui Yu 在OpenAI 領導感知團隊,此前,他在伊利諾大學厄巴納- 香檳分校獲得博士
學位。在加入OpenAI 之前,Jiahui Yu 在Google參與的研究包括Gemini、PaLM 2 等。
Huiwen Chang
Huiwen Chang 於2023 年加入OpenAI,此前她在谷歌擔任高級研究科學家,本科畢業於清
華大學。
A. Jabri
A. Jabri 為OpenAI 的技術人員,主要研究領域是用於自監督和無監督學習的可擴展目標
和架構。此前曾在谷歌DeepMind實習。
Christine McLeavey
Christine McLeavey 是OpenAI 的技術團隊成員,主要進行多模態研究工作。她的研究興
趣主要在於音樂生成,她也是OpenAI 音樂模式MuseNet 研究團隊成員。
Yu Zhang
Yu Zhang 是OpenAI 技術團隊成員,曾在GoogleDeepMind擔任了6 年的研究科學家。
Yu Zhang 本科畢業於上海交通大學計算機科學系,博士畢業於MIT 計算機科學系。
除了上述的這些研究者,OpenAI 官方也放出了完整名單:
完整名單地址:https://openai.com/gpt-4o-contributions/
其中,語言方面的核心貢獻者包括:
https://tinyurl.com/y6248p4c
多模態核心貢獻者包括:
https://tinyurl.com/y7kmxbkz
有興趣的讀者,可以查看完整名單以了解更多資訊。
--