起猛了,GPT-4o被谷歌新模型擊敗,ChatGPT官號(hào):大家深吸一口氣
相信很多大家對(duì)起猛了,GPT-4o被谷歌新模型擊敗,ChatGPT官號(hào):大家深吸一口氣還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
起猛了,GPT-4o被谷歌新模型超越了!
歷時(shí)一周,超1,2000人匿名投票,Gemini1.5Pro(0801)代表谷歌首次奪得lmsys競(jìng)技場(chǎng)第一。(中文任務(wù)也第一)
而且這次還是雙冠王,除了總榜(唯一分?jǐn)?shù)上1300),在視覺(jué)排行榜上也是第一。
Gemini團(tuán)隊(duì)的關(guān)鍵人物Simon Tokumine發(fā)文慶祝稱(chēng):
一位Reddit用戶(hù)也稱(chēng)該模型“非常好”,并表示希望其功能不會(huì)被縮減。
更多網(wǎng)友興奮表示,OpenAI終于受到挑戰(zhàn),要發(fā)布新版本來(lái)反擊了!
ChatGPT官方賬號(hào)也出來(lái)暗示著什么。
一片熱鬧之際,谷歌AI Studio產(chǎn)品負(fù)責(zé)人宣布該模型進(jìn)入免費(fèi)測(cè)試階段:
網(wǎng)友:谷歌終于來(lái)了!
嚴(yán)格來(lái)說(shuō),Gemini1.5Pro(0801)其實(shí)不算新模型。
該實(shí)驗(yàn)性版本建立在谷歌2月發(fā)布的Gemini1.5Pro基礎(chǔ)之上,后來(lái)1.5系列將上下文窗口擴(kuò)展到了200萬(wàn)。
隨著模型更新,這命名也是越來(lái)越長(zhǎng)了,也引起人們一片吐槽。
這不,一位OpenAI員工祝賀之余不忘陰陽(yáng)怪氣一把:
當(dāng)然了,雖然名字難記,但Gemini1.5Pro(0801)這次在競(jìng)技場(chǎng)官方評(píng)測(cè)中表現(xiàn)亮眼。
總體勝率熱圖顯示,它比GPT-4o勝出54%,比Claude3.5Sonnet勝出59%。
在多語(yǔ)言能力基準(zhǔn)測(cè)試中,它在中文、日語(yǔ)、德語(yǔ)、俄語(yǔ)均排名第一。
但是,在Coding、Hard Prompt Arena中,它還是打不過(guò)Claude3.5Sonnet、GPT-4o、Llama405B等對(duì)手。
這一點(diǎn)也遭到網(wǎng)友詬病,轉(zhuǎn)譯過(guò)來(lái)就是:
不過(guò)也有人出來(lái)安利Gemini1.5Pro(0801)的圖像和PDF提取功能。
DAIR.AI聯(lián)合創(chuàng)始人Elvis親自在油管做了全套測(cè)試,并總結(jié)道:
以及,有人拿Gemini1.5Pro(0801)來(lái)解決Claude3.5Sonet之前回答不好的問(wèn)題。
結(jié)果一看,它不僅表現(xiàn)更好,同時(shí)也干掉了自家小伙伴Gemini1.5Flash。
不過(guò)嘛,一些經(jīng)典常識(shí)測(cè)試它還是搞不定,比如“寫(xiě)十個(gè)以蘋(píng)果結(jié)尾的句子”。
One More Thing
與此同時(shí),谷歌Gemma2系列迎來(lái)了一個(gè)新的20億參數(shù)模型。
Gemma2(2B)開(kāi)箱即用,可以在Google Colab的免費(fèi)T4GPU上運(yùn)行。
在競(jìng)技場(chǎng)排行榜上,它超過(guò)了所有GPT-3.5模型,甚至超越了Mixtral-8x7b。
面對(duì)谷歌最新取得的一系列新排名,競(jìng)技場(chǎng)榜單權(quán)威性再次受到大家質(zhì)疑。
Nous Research聯(lián)合創(chuàng)始人Teknium(微調(diào)后訓(xùn)練領(lǐng)域知名玩家)發(fā)文提醒:
Abacus.AI首席執(zhí)行官Bindu Reddy更是直接呼吁:
那么,你認(rèn)為這種人類(lèi)匿名投票的方式還靠譜嗎?(歡迎評(píng)論區(qū)討論)
參考鏈接:
[1]https://x.com/lmsysorg/status/1819048821294547441
[2]https://x.com/JeffDean/status/1819121162578022849
[3]https://x.com/stevenheidel/status/1819080995062403484
[4]https://x.com/rohanpaul_ai/status/1818697538360295897
[5]https://x.com/bindureddy/status/1818738366466412601
[6]https://x.com/infwinston/status/1818718423700103526
—完—
以上就是關(guān)于【起猛了,GPT-4o被谷歌新模型擊敗,ChatGPT官號(hào):大家深吸一口氣】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!