GPT-4o mini背后團隊揭秘:9人團華人面孔過半,清華北大同濟校友在列
相信很多大家對GPT-4o mini背后團隊揭秘:9人團華人面孔過半,清華北大同濟校友在列還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
“大模型尺寸之爭正在加速……倒退!”
OpenAI的GPT-4o mini一登場,又登上了大模型話題榜榜首。
并且這次話題焦點,是OpenAI不僅再樹新標桿,還一出手就把性價比卷爆了——直接把此前大受開發(fā)者好評的Gemini1.5Flash和Claude3Haiku給碾壓了。
這不,大神Karpathy火速發(fā)了篇小作文,做出開頭提到的這么一句判斷,并進一步解釋:
總之,開發(fā)者們的心情be like:
兩年內(nèi)大模型成本直降99%,今天宜當開發(fā)者。
鑼鼓喧天的熱烈討論中,GPT-4o mini背后團隊也沒藏著掖著,都在??上賣力宣傳了起來,并不吝對自家“殺手級團隊”的自豪。
也再度引來外界對OpenAI人才的關注。
我們扒了扒,發(fā)現(xiàn)其中依然不乏華人面孔。
半數(shù)Leader是華人
OpenAI照例在博客末尾附上了團隊負責人名單。
此番9位負責人中,有5位都是華人面孔。
Kevin Lu,自述最近剛加入OpenAI。2021年畢業(yè)于加州大學伯克利分校,就讀期間受伯克利人工智能研究所(BAIR)聯(lián)合主任Pieter Abbeel和谷歌DeepMind研究科學家Igor Mordatch指導,研究方向是強化學習和序列建模。
Shengjia Zhao,OpenAI研究科學家,方向為ChatGPT的訓練和對齊。他于2022年加入OpenAI,博士畢業(yè)于斯坦福大學計算機科學系,本科畢業(yè)于清華大學。
任泓宇,去年加入OpenAI擔任研究科學家,主要負責語言模型訓練。他也是GPT-4o的核心開發(fā)者、GPT-Next項目組成員。
任泓宇本科畢業(yè)于北京大學,博士畢業(yè)于斯坦福大學。加入OpenAI之前,他在Apple、Google、NVIDIA 和Microsoft均有大量研究實習經(jīng)歷。
Haitang Hu,去年9月加入OpenAI。他在2011年本科畢業(yè)于同濟大學計算機專業(yè),后赴約翰·霍普金斯大學攻讀計算機碩士。
加入OpenAI前,他在Google工作了7年多。參與過TensorFlow以及大語言模型基礎設施的研發(fā)工作。
項目經(jīng)理Mianna Chen,也是GPT-4o的項目經(jīng)理。她于2023年12月加入OpenAI,之前在Google和DeepMind擔任產(chǎn)品經(jīng)理。她畢業(yè)于普林斯頓大學,也是沃頓商學院的MBA。
除了以上幾位華人面孔,GPT-4o mini團隊還有其他幾位核心成員。
Jacob Menick,2022年9月加入OpenAI擔任研究員,是GPT-4o mini的技術總負責人。
他還曾共同參與領導了GPT-4o預訓練工作,以及ChatGPT 瀏覽功能和機器學習工具使用的開發(fā),在2023年4月和5月期間負責旗艦模型的后訓練工作。
在加入OpenAI前,他在DeepMind干了6年多,參與了Gopher、RETRO和Flamingo等主要語言模型項目,并為DeepMind多模態(tài)大模型鋪平了道路。
Eric Wallace,去年11月加入OpenAI擔任研究員,致力于大模型更可靠、安全和強大。
目前他還在加州大學伯克利分校讀博,研究方向是增強機器學習的安全性/隱私性/魯棒性。在加入OpenAI之前,他還在DeepMind和Meta實習過。
Nick Stathas,去年5月加入OpenAI,擁有高性能計算、機器學習、自動駕駛車輛和嵌入式系統(tǒng)等領域的經(jīng)驗。他本碩均就讀于麻省理工學院,曾在MIT Driverless兼職首席工程師,負責無人駕駛汽車的自動駕駛軟件開發(fā)。
Felipe Petroski Such,GPT-4o mini團隊中最早加入(2020年)OpenAI的人,也是GPT-4o的核心貢獻者。
在加入OpenAI之前,他還在Uber擔任了3年多研究科學家。再往前,他就讀于羅切斯特理工學院,獲得了計算機工程雙學位,并在擔任研究助理期間,專注于深度學習研究,包括文檔分類、分割和智能字符識別。
mini速度到底有多快
說完了背后的人,回到GPT-4o mini本身,總結(jié)一下這波就是主打一個又快又便宜,要在開發(fā)者面前找回場子。
那么除了數(shù)據(jù)之外,最后,我們也不妨來實測一波它到底能有多快。
先直觀感受一波速度:
(滑屏速度快趕不上生成速度了)
還有網(wǎng)友把GPT-4o mini和另一位當紅炸子雞Claude3.5Sonnet放在Cursor上,來了場1v1。
另外,在面對長文本生成需求時,GPT-4o mini的16k輸出長度確實比Claude3.5Sonnet的8k輸出長度更好用。
比如做這道800字的高考作文題,相比于GPT-4o mini的庫庫輸出,Claude同學“總之”剛寫了半句就停下了,最后也沒寫完這篇作文。
正如網(wǎng)友所說,1.09元人民幣/百萬輸入tokens、4.36元人民幣/百萬輸出token的價格,基本上就是Claude3Haiku價格的一半,GPT-4o mini能有這表現(xiàn),還要啥自行車。
畢竟,這可能一下子就讓某些產(chǎn)品告別虧錢走向盈利了(doge)。
不過,也有人不買賬:
還有網(wǎng)友干脆陰陽怪氣了起來:
還是那個問題:GPT-5呢?
參考鏈接:
[1]https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/
[2]https://x.com/karpathy/status/1814038096218083497
—完—
以上就是關于【GPT-4o mini背后團隊揭秘:9人團華人面孔過半,清華北大同濟校友在列】的相關內(nèi)容,希望對大家有幫助!