日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

      <td id="p7kjh"></td>
      <td id="p7kjh"></td>

      一個提問高下立見?國產(chǎn)AI大模型沖上扣子廣場PK

      發(fā)布時間:2024-06-14 15:30:06 編輯: 來源:
      導讀 相信很多大家對一個提問高下立見?國產(chǎn)AI大模型沖上扣子廣場PK還不知道吧,今天菲菲就帶你們一起去了解一下~.~! 以“國產(chǎn)GPTs”出名的扣子...

      相信很多大家對一個提問高下立見?國產(chǎn)AI大模型沖上扣子廣場PK還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

      以“國產(chǎn)GPTs”出名的扣子,做出了GPT沒有的功能。

      6月12日,字節(jié)跳動旗下的AI應用開發(fā)平臺“扣子”(Coze國內(nèi)版)悄悄上線了新功能“模型廣場”。

      扣子是AI應用開發(fā)平臺,無論用戶是否有編程基礎,都可以在扣子上快速搭建基于大模型的各種聊天機器人(AI Bot),并一鍵發(fā)布到飛書、微信等各個社交平臺。

      而新上線的模型廣場,可以讓兩個大語言模型實時PK,一決勝負,幫助用戶挑選出最適合自己的大語言模型。

      據(jù)了解,扣子目前已經(jīng)接入了包括豆包、通義千問、MiniMax、Moonshot、百川智能、智譜等多個國內(nèi)大語言模型。換言之,這是國內(nèi)多家知名大模型廠商與字節(jié)的強強聯(lián)動。

      哪款大模型最適合自己的AI應用?創(chuàng)作者們在打造AI Bot時該選哪個模型?自定義主題Bot的魅力在哪?“頭號AI玩家”第一時間上手進行了一番實測。

      超低門檻搭建Bot,讓大模型匿名PK

      國內(nèi)大模型到底哪家更厲害,遇到問題時該選擇哪個AI解決,扣子模型廣場提供的就是快速測試的方法。

      具體來說,模型廣場采用了指定Bot對戰(zhàn)、隨機Bot對戰(zhàn)以及純模型對戰(zhàn)模式,任一模式下,系統(tǒng)都會先匹配兩款匿名大模型,隨后用戶進行提問,模型實時生成答案進行PK。

      根據(jù)模型的回答質(zhì)量,我們可以投票選出表現(xiàn)較好的模型,孰強孰弱一目了然。

      任意模型完成回答后,用戶可以參與投票

      先從最基礎的模型能力評測入手,如果我需要搭建一個“友好語氣轉(zhuǎn)換器(陰陽版)”,哪個大語言模型的回復既禮貌但不冒犯?

      現(xiàn)在直接讓模型“打一架”,就可以評估大模型在面對細分需求時的表現(xiàn)差異。

      我們在扣子模型廣場點擊“純模型對戰(zhàn)”,進入對決頁面,兩款匿名模型已經(jīng)在后臺準備就緒了。

      隨后,我輸入了需要創(chuàng)建的AI Bot角色設定,并一鍵發(fā)送給兩個身份未知的大語言模型,內(nèi)容如下:

      兩款匿名大模型實時響應提問,其中,最先給出回答的大模型B只花了4.9秒。

      任意一個模型回答完后,就可以基于內(nèi)容質(zhì)量、回復時間等要素,來判斷哪個模型表現(xiàn)更好。

      實際測試中,綜合響應時長以及內(nèi)容“陰陽怪氣”的程度,我把這一票投給了大模型A。投票完成后,模型廣場會顯示剛才參與競賽的兩位模型選手,比如被我選中獲勝的模型A實際上是豆包。點擊展開,還能獲得更多模型參數(shù)。

      投票完成頁面

      當然,也可以選擇重開一輪。比如由于我還想了解其他模型會如何“陰陽怪氣”,就點了“重開一輪”,很快,系統(tǒng)重新匹配了兩個新模型進行對戰(zhàn)。

      通過多輪評估對比,我們發(fā)現(xiàn)在“友好語氣轉(zhuǎn)換器”這一機器人創(chuàng)建需求中,豆包和Moonshot給出的結(jié)果不相上下,豆包回答簡單毒舌,Moonshot配合表情之后,把“暗諷”拿捏到位。

      那么,考慮到我希望聊天機器人在對話時帶上emoji,所以會更青睞活潑一點的Moonshot。

      需要說明的是,這里的投票完全是依據(jù)個人主觀喜好,所以與其說哪家模型更強,不如說哪家更適合。

      目前,市面上也有較權(quán)威的評測,像LMSYS的模型競技場,也是讓全球用戶可以自由評測大模型的能力,選出優(yōu)勝模型??圩拥哪P蛷V場也有相同的功能。

      對于開發(fā)者來說,如何選擇更優(yōu)的底層模型打造AI Bot是十分值得關(guān)心的問題。畢竟在大模型行業(yè),基礎模型的能力幾乎決定著AI Bot能多大程度發(fā)揮作用。

      但很多人在創(chuàng)建AI Bot時,其實無法看懂復雜的榜單數(shù)據(jù),甚至不夸張地說,國產(chǎn)AI大模型各個當過第一?,F(xiàn)在,“純模型”之間可以進行對戰(zhàn),以文本生成的硬實力PK,這樣的優(yōu)勢在于方便小白用戶自行選擇模型。

      除此之外,也可以在模型競技場中選擇感興趣的Bot開啟模型對戰(zhàn)。和GPTs商店類似,入圍模型廣場的AI Bot是官方精選推薦的。

      比如,我選擇了“奇遇旅行家”Bot來制定一個出行計劃,同樣能將“我要從上海出發(fā)到阿勒泰,請幫我找到便宜的機票,并制定一份出行規(guī)劃”這個問題,一鍵發(fā)給兩個模型。

      不到15秒的時間,匿名模型先后給出了兩個完全不同的方案,對于出行需要Plan B的我來說,的確大大縮短了規(guī)劃時間。

      換言之,對于普通用戶而言,同一個問題可以同時投喂給兩個大語言模型,短時間內(nèi)可以獲得更多回復,一定程度上可以提高獲取信息的效率。此外,也可以在一個平臺掌握各大模型的最新能力,扣子實現(xiàn)了模型Bot的聚合。

      驗證模型再疊技能,AI還能怎么玩

      需要說明的是,模型廣場評估的只是大模型本身在文本生成等方面的能力,不受編排、工作流等配置的影響和限制。

      所以,如果想要打造出一個能力出眾的Bot,還需要進一步給AI附加一些額外能力。

      比如,讓Genmoji Bot調(diào)用表情包插件,或是創(chuàng)作完整的工作流,和大語言模型結(jié)合完成更多復雜功能。

      在扣子Bot商店,有不少網(wǎng)友通過AI Bot實現(xiàn)自己的創(chuàng)意。AI最大的魅力,大概就在于你壓根沒想到這些東西能這么用。

      6月12日,扣子還和Intel聯(lián)合推出了“Coze AI Factory”主題Bot征集活動,包括圖文創(chuàng)作、實用工具、互動創(chuàng)意等不同賽道。

      https://www.coze.cn/docs/guides/coze_ai_factory

      網(wǎng)友們靠調(diào)用插件、增加工作流,調(diào)教了形形色色的角色,整了不少花活,比如“單人劇本殺”“本命粽子”“Emoji翻譯器”等等。

      這些有意思的Bot也會吸引更多開發(fā)者上手一試,從中尋找創(chuàng)建靈感。

      比如可以在Bot商店選擇感興趣的Bot,查看相應的提示詞,甚至在個人空間里復刻一個相似的,替換成更心儀的大語言模型。

      我們體驗下來也發(fā)現(xiàn),如此一來,零基礎就可以開發(fā)一款契合自己的AI Bot。借助模型廣場,還能在創(chuàng)建AI Bot時選擇更偏好的大模型。這樣一來,人人都可以靈活地配置生成不同的Bot,還能低成本實現(xiàn)突如其來的創(chuàng)意。

      字節(jié)AI新王牌,想做大模型風向標?

      隨著大模型技術(shù)不斷發(fā)展,國內(nèi)大廠幾乎都瞄準了構(gòu)建AI原生應用平臺,類GPTs的產(chǎn)品遠不止扣子。此前百度上線了文心一言智能體平臺,阿里云布局推出百煉大模型平臺。前不久,騰訊一站式智能體制作平臺“元器”也公開灰度測試。

      不少觀點認為,具有專業(yè)能力的智能體,能夠撬動大模型商業(yè)化。但如何在其中脫穎而出,做出差異化競爭是大模型廠商們共同面對的問題。

      目前看來,挖掘大模型技術(shù)上的潛力,匯聚開發(fā)者甚至非開發(fā)者,扣子靠模型競技場已經(jīng)邁出了第一步。

      模型競技場,意味著字節(jié)聯(lián)動阿里、百川智能和月之暗面等,讓用戶能夠快速基于多種大模型創(chuàng)建應用??圩拥牡讓右膊辉倬窒抻谧匝械亩拱竽P停饾u走向開放,吸引更多開發(fā)者。

      圖片來源:扣子微信公眾平臺

      對于大廠來說,開發(fā)者生態(tài)就像是“蓄水池”,繁榮的生態(tài)和穩(wěn)固的底層技術(shù)向來相輔相成,規(guī)?;拈_發(fā)者聚合效應能進一步提升大模型能力。

      繼此前推出9個豆包大模型全家桶,打響大模型價格戰(zhàn)后,字節(jié)正在圍繞AI尋找應用落地場景,以觸達更多用戶。

      以扣子、豆包等為基礎,字節(jié)似乎正嘗試搭建起一個能夠吸引開發(fā)者與用戶、覆蓋各領(lǐng)域的AI應用生態(tài),進一步對B端業(yè)務發(fā)起攻勢。

      火山引擎總裁譚待此前接受采訪時表示,應用生態(tài)的構(gòu)建不是一天兩天就能形成的,反而是一堆人的群體智慧??圩颖仨氁獦?gòu)建低代碼生態(tài),能夠讓很多人用低門檻做更多事情,才能形成AI時代的創(chuàng)新。

      這或許也在暗示,扣子選擇上線模型廣場的原因,是鼓勵更多大模型進行合作,收集真實的應用場景數(shù)據(jù),為優(yōu)化模型提供參考。

      正如很多業(yè)內(nèi)人士提到的,AI的價值應該體現(xiàn)在它如何幫助人們解決問題、提高效率上,而不僅僅是技術(shù)層面的“最強”。

      以上就是關(guān)于【一個提問高下立見?國產(chǎn)AI大模型沖上扣子廣場PK】的相關(guān)內(nèi)容,希望對大家有幫助!

      免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

      熱點推薦

      精選文章