日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

      <td id="p7kjh"></td>
      <td id="p7kjh"></td>

      首頁 >> 今日更新 >

      中國(guó)版GPT-4o炸場(chǎng):國(guó)內(nèi)首個(gè)流式多模態(tài)交互模型,現(xiàn)場(chǎng)實(shí)時(shí)且絲滑

      2024-07-05 18:00:04 來源: 用戶: 

      相信很多大家對(duì)中國(guó)版GPT-4o炸場(chǎng):國(guó)內(nèi)首個(gè)流式多模態(tài)交互模型,現(xiàn)場(chǎng)實(shí)時(shí)且絲滑還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

      沒等到GPT-4o,商湯先把《Her》給發(fā)布出來了!

      就在剛剛,商湯直接在現(xiàn)場(chǎng)來了個(gè)炸裂的Live Show,話不多說,直接看效果:

      不僅聲音非常擬人(觀眾直呼好磁性),而且還是實(shí)時(shí)、隨時(shí)可以打斷的那種!

      它宛如被安上了一對(duì)兒眼睛,可以做到精準(zhǔn)無誤的所見即所得。

      就連手繪的粗糙的簡(jiǎn)筆畫,AI也能俏皮地跟人類做互動(dòng):

      一波Live Show秀下來,引得觀眾掌聲連連、“哇”聲一片。

      這就是商湯發(fā)布的國(guó)內(nèi)首個(gè)流式原生多模態(tài)交互模型——6000億參數(shù)日日新5.5系列中的5o所達(dá)到的效果。

      據(jù)了解,這是一種全新的AI交互模式,把文本、聲音、圖像還有視頻等模態(tài)全都囊括到了一起,可以讓AI跟人們交流的時(shí)候變得更加生動(dòng)豐富。

      可以說是真·電影走進(jìn)現(xiàn)實(shí)了。

      而且商湯CEO徐立現(xiàn)場(chǎng)表示,很快就可以用上了!

      但新的AI交互模型,也還僅僅是商湯在這次發(fā)布中的一隅。

      縱觀整場(chǎng)活動(dòng),商湯可以說是圍繞著日日新5.5,把多模態(tài)這事給玩兒得66的。

      各位看官,咱們繼續(xù)往下瞧。

      計(jì)算機(jī)巨佬們“活”了起來

      你沒看錯(cuò),商湯用新AI搞的另一個(gè)花活兒,就是“復(fù)活”了圖靈、馮諾依曼等計(jì)算機(jī)巨佬們。

      并且還致敬了已故的人工智能科學(xué)家,商湯科技創(chuàng)始人湯曉鷗老師,徐立表示:

      請(qǐng)看VCR:

      這個(gè)新AI,名叫Vimi,是基于日日新5.5能力打造的首個(gè)可控人物視頻生成大模型。

      而且是只需要一張任意風(fēng)格照片就能搞定、普通用戶都可以用、長(zhǎng)達(dá)1分鐘的那種哦~

      要知道,“人物可控”這事一直是用大模型搞生成的一道難題,就連Sora在內(nèi)大模型也面臨無法精準(zhǔn)控制動(dòng)作、連續(xù)性不穩(wěn)定(突然變臉)等問題。

      但Vimi就不一樣了,它不僅能夠精確地控制人物的面部表情,還能在半身像的范圍內(nèi)調(diào)節(jié)人物的自然姿態(tài)。

      并且也能夠自動(dòng)生成與人物相匹配的頭發(fā)、服裝以及背景的變化;時(shí)長(zhǎng)方面更是達(dá)到了分鐘級(jí)別。

      由此,以后要是想打造一個(gè)自己的大片兒,例如冰雪女王,那就是一張照片的事兒了:

      以下視頻來源于Vimi相機(jī)

      以為這就完了?No,No,No。

      你的表情包又要變豐富了。

      總而言之,Vimi的出現(xiàn)可以說是利好視頻創(chuàng)作者,讓他們有了另一個(gè)高質(zhì)量AI工具的選擇。

      值得一提的是,Vimi還被這次世界人工智能大會(huì)(WAIC)官方授予了最高榮譽(yù)——鎮(zhèn)館之寶。

      怎么做到的?

      對(duì)于能取得上述效果背后的殺手锏技術(shù),商湯在現(xiàn)場(chǎng)也做出了大揭秘。

      一方面是架構(gòu)。

      日日新5.5采用的是混合端邊云協(xié)同專家架構(gòu),可以最大限度發(fā)揮云邊端協(xié)同,降低推理成本。

      另一方面是數(shù)據(jù)。

      日日新5.5在模型訓(xùn)練上基于超過10TB tokens高質(zhì)量訓(xùn)練數(shù)據(jù),包括大量合成的思維鏈數(shù)據(jù),其語言理解和交互能力全面升級(jí)。

      因此,日日新5.5在數(shù)學(xué)、推理、編程等多個(gè)維度較上個(gè)版本具有較大的提升,尤其是在數(shù)學(xué)推理(↑31.5%)英文理解(↑53.8%)、指令跟隨(↑26.8%)等核心指標(biāo)方面。

      那么這一點(diǎn)又該如何體現(xiàn)呢?權(quán)威評(píng)測(cè)榜單,便是一個(gè)很好的印證。

      例如根據(jù)OpenCompass的評(píng)測(cè),日日新5.5的平均分?jǐn)?shù)已經(jīng)與GPT-4o持平,并且多想細(xì)分維度的分?jǐn)?shù)是超越了GPT-4o的。

      不要999,不要99,只要9.9元全年

      除了多模態(tài)之外,端側(cè),也是此次商湯著重的發(fā)力點(diǎn)之一。

      現(xiàn)在的日日新端側(cè)模型5.5Lite同樣也在性能指標(biāo)的各維度上做到了全面升級(jí)。

      基于手機(jī)旗艦平臺(tái),5.5Lite首次安裝包的耗時(shí)僅為0.19秒,相較于之前的版本減少了40%。

      它的推理速度提高了15%,達(dá)到每秒90.2個(gè)漢字的處理速度。

      此外,商湯還推出了端側(cè)模型矩陣,其中包括商量Mini寫作助手、總結(jié)助手和百科助手等專門定制的模型。

      這些專項(xiàng)模型在相應(yīng)的場(chǎng)景下具有更優(yōu)異的性能,能夠滿足客戶復(fù)雜業(yè)務(wù)場(chǎng)景的需求,同時(shí)也能夠提供不同的專項(xiàng)模型供客戶選擇或定制。

      而且基于日日新5.5的端側(cè)大模型還做到了“多快好”,還做到了“省”——每臺(tái)使用成本最低可達(dá)每年9.9元。

      在企業(yè)方面,與商湯達(dá)成合作的企業(yè)用戶已經(jīng)超過3000家,覆蓋領(lǐng)域包括互聯(lián)網(wǎng)、醫(yī)療、金融和編程等等。

      而說到價(jià)格,說到普惠,就不得不提商湯此次提出的“0元Go”計(jì)劃了:

      那么看完商湯此次的整場(chǎng)發(fā)布,我們還需要回答一個(gè)問題:

      對(duì)于這個(gè)問題,商湯CEO徐立給出了他的解讀:

      因此,應(yīng)用,或許就成為了決定這個(gè)時(shí)代是不是人工智能超級(jí)時(shí)刻的一個(gè)關(guān)鍵。

      這也就是為什么商湯要推出流式原生多模態(tài)交互模型的原因了,只有做到了更豐富更精準(zhǔn)的多模態(tài),以及更低延時(shí)更可控,方可讓應(yīng)用這件事更上一層樓。

      總而言之,思路已然清晰,技術(shù)不斷進(jìn)步,屬于AI2.0的超級(jí)時(shí)刻或許正在加速向我們逼近。

      以上就是關(guān)于【中國(guó)版GPT-4o炸場(chǎng):國(guó)內(nèi)首個(gè)流式多模態(tài)交互模型,現(xiàn)場(chǎng)實(shí)時(shí)且絲滑】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!

        免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!

       
      分享:
      最新文章