日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

<td id="p7kjh"></td>

<td id="p7kjh"></td>

<td id="vkpg2"><input id="vkpg2"></input></td>

起猛了，GPT-4o被谷歌新模型擊敗，ChatGPT官號(hào)：大家深吸一口氣

發(fā)布時(shí)間：2024-08-02 14:30:31 編輯：來(lái)源：

導(dǎo)讀相信很多大家對(duì)起猛了，GPT-4o被谷歌新模型擊敗，ChatGPT官號(hào)：大家深吸一口氣還不知道吧，今天菲菲就帶你們一起去了解一下~.~！起猛了，G...

相信很多大家對(duì)起猛了，GPT-4o被谷歌新模型擊敗，ChatGPT官號(hào)：大家深吸一口氣還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

起猛了，GPT-4o被谷歌新模型超越了!

歷時(shí)一周，超1，2000人匿名投票，Gemini1.5Pro（0801）代表谷歌首次奪得lmsys競(jìng)技場(chǎng)第一。（中文任務(wù)也第一）

而且這次還是雙冠王，除了總榜（唯一分?jǐn)?shù)上1300），在視覺(jué)排行榜上也是第一。

Gemini團(tuán)隊(duì)的關(guān)鍵人物Simon Tokumine發(fā)文慶祝稱(chēng):

一位Reddit用戶(hù)也稱(chēng)該模型“非常好”，并表示希望其功能不會(huì)被縮減。

更多網(wǎng)友興奮表示，OpenAI終于受到挑戰(zhàn)，要發(fā)布新版本來(lái)反擊了!

ChatGPT官方賬號(hào)也出來(lái)暗示著什么。

一片熱鬧之際，谷歌AI Studio產(chǎn)品負(fù)責(zé)人宣布該模型進(jìn)入免費(fèi)測(cè)試階段:

網(wǎng)友:谷歌終于來(lái)了!

嚴(yán)格來(lái)說(shuō)，Gemini1.5Pro（0801）其實(shí)不算新模型。

該實(shí)驗(yàn)性版本建立在谷歌2月發(fā)布的Gemini1.5Pro基礎(chǔ)之上，后來(lái)1.5系列將上下文窗口擴(kuò)展到了200萬(wàn)。

隨著模型更新，這命名也是越來(lái)越長(zhǎng)了，也引起人們一片吐槽。

這不，一位OpenAI員工祝賀之余不忘陰陽(yáng)怪氣一把:

當(dāng)然了，雖然名字難記，但Gemini1.5Pro（0801）這次在競(jìng)技場(chǎng)官方評(píng)測(cè)中表現(xiàn)亮眼。

總體勝率熱圖顯示，它比GPT-4o勝出54%，比Claude3.5Sonnet勝出59%。

在多語(yǔ)言能力基準(zhǔn)測(cè)試中，它在中文、日語(yǔ)、德語(yǔ)、俄語(yǔ)均排名第一。

但是，在Coding、Hard Prompt Arena中，它還是打不過(guò)Claude3.5Sonnet、GPT-4o、Llama405B等對(duì)手。

這一點(diǎn)也遭到網(wǎng)友詬病，轉(zhuǎn)譯過(guò)來(lái)就是:

不過(guò)也有人出來(lái)安利Gemini1.5Pro（0801）的圖像和PDF提取功能。

DAIR.AI聯(lián)合創(chuàng)始人Elvis親自在油管做了全套測(cè)試，并總結(jié)道:

以及，有人拿Gemini1.5Pro（0801）來(lái)解決Claude3.5Sonet之前回答不好的問(wèn)題。

結(jié)果一看，它不僅表現(xiàn)更好，同時(shí)也干掉了自家小伙伴Gemini1.5Flash。

不過(guò)嘛，一些經(jīng)典常識(shí)測(cè)試它還是搞不定，比如“寫(xiě)十個(gè)以蘋(píng)果結(jié)尾的句子”。

One More Thing

與此同時(shí)，谷歌Gemma2系列迎來(lái)了一個(gè)新的20億參數(shù)模型。

Gemma2（2B）開(kāi)箱即用，可以在Google Colab的免費(fèi)T4GPU上運(yùn)行。

在競(jìng)技場(chǎng)排行榜上，它超過(guò)了所有GPT-3.5模型，甚至超越了Mixtral-8x7b。

面對(duì)谷歌最新取得的一系列新排名，競(jìng)技場(chǎng)榜單權(quán)威性再次受到大家質(zhì)疑。

Nous Research聯(lián)合創(chuàng)始人Teknium（微調(diào)后訓(xùn)練領(lǐng)域知名玩家）發(fā)文提醒:

Abacus.AI首席執(zhí)行官Bindu Reddy更是直接呼吁:

那么，你認(rèn)為這種人類(lèi)匿名投票的方式還靠譜嗎?（歡迎評(píng)論區(qū)討論）

參考鏈接:

[1]https://x.com/lmsysorg/status/1819048821294547441

[2]https://x.com/JeffDean/status/1819121162578022849

[3]https://x.com/stevenheidel/status/1819080995062403484

[4]https://x.com/rohanpaul_ai/status/1818697538360295897

[5]https://x.com/bindureddy/status/1818738366466412601

[6]https://x.com/infwinston/status/1818718423700103526

—完—

以上就是關(guān)于【起猛了，GPT-4o被谷歌新模型擊敗，ChatGPT官號(hào)：大家深吸一口氣】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

免責(zé)聲明：本文由用戶(hù)上傳，如有侵權(quán)請(qǐng)聯(lián)系刪除！

相關(guān)閱讀

最新文章

<td id="fpbn3"><s id="fpbn3"></s></td>

<pre id="fpbn3"></pre>