日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

      <td id="p7kjh"></td>
      <td id="p7kjh"></td>

      試了試MiniMax新出的Al視頻模型,發(fā)現(xiàn)它生成人物的“演技”吊打內(nèi)娛

      發(fā)布時間:2024-09-09 09:30:35 編輯: 來源:
      導讀 相信很多大家對試了試MiniMax新出的Al視頻模型,發(fā)現(xiàn)它生成人物的“演技”吊打內(nèi)娛還不知道吧,今天菲菲就帶你們一起去了解一下~.~! 最近...

      相信很多大家對試了試MiniMax新出的Al視頻模型,發(fā)現(xiàn)它生成人物的“演技”吊打內(nèi)娛還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

      最近刷屏AI圈的大事件,無外乎MiniMax推出了視頻生成工具海螺AI。

      科技博主們對它寄予厚望,紛紛感嘆“忘了Sora,MiniMax的視頻生成模型已經(jīng)獲得了巨大進步”“中國又出了一個強力競爭對手”“我見過手部動作最自然的模型”……

      電影制作人們用它開始玩起了短片,賽博科幻風、暗黑恐怖風都沒在怕的。

      短片《A Place in Hell》

      截至目前,海螺AI生成視頻合集在X平臺上獲得了超1800萬瀏覽量,不少國外網(wǎng)友用它對知名IP進行二創(chuàng),《星球大戰(zhàn)》的經(jīng)典場面已經(jīng)獲得了約500萬次的觀看。

      這款刷屏各個社交平臺的視頻生成工具——海螺AI,由大模型公司MiniMax自研發(fā)布,可以一次性生成長度為6秒的短視頻。

      8月31日,MiniMax發(fā)布了一段以“魔法硬幣”為主題的宣傳視頻,視頻畫面、音效完全由MiniMax旗下的視頻、語音大模型完成。

      目前,海螺AI的視頻創(chuàng)作功能已經(jīng)在網(wǎng)頁端上線,用戶可在首頁點擊“創(chuàng)作視頻”,即可限時免費生成視頻。

      “AI新榜”也進行了一番實測,涵蓋人物、文字、風景等多種鏡頭表現(xiàn)類型,我們意外發(fā)現(xiàn)在人物情緒表達、鏡頭運動等視頻類型上,MiniMax展現(xiàn)出了一定優(yōu)勢。當然,我們也在測試過程中遇到了一些海螺AI的問題和短板。

      本篇將結(jié)合不同視頻生成工具的呈現(xiàn)效果,包括文生視頻公認的王者Runway以及媲美Sora的國內(nèi)AI可靈,看看MiniMax究竟能不能成為視頻生成賽道的最強黑馬?

      01

      實測MiniMax海螺AI,生成視頻有了“人味”?

      根據(jù)不少創(chuàng)作者的測試反饋,海螺AI在人物表情生成上表現(xiàn)相當出色。

      “情緒表達”對于AI來說是一個難題,Runway旗下的模型達到情緒轉(zhuǎn)換,往往需要借助運動筆刷功能,進行細節(jié)調(diào)試,更不用說直接能借助提示詞轉(zhuǎn)換情感表達了。

      圖片來源:科技博主“歸藏”發(fā)布的視頻截圖

      海螺AI真能讓人物實現(xiàn)“光速變臉”?我們來上手測試一下。

      人物類

      海螺:

      可靈:

      Runway:

      在沒有風格提示詞的情況下,無論是可靈、海螺還是Runway,都會生成寫實風格的視頻。

      不同的是,短短6秒內(nèi),海螺展現(xiàn)了一個中年男人從悲傷到快樂到尷尬的變臉故事。可靈沒有遵循文字提示中的具體動作轉(zhuǎn)變——“戴上了假發(fā)和眼鏡”,而是展現(xiàn)了中年男人已經(jīng)戴上的狀態(tài)。

      Runway這輪生成的視頻中出現(xiàn)了肉眼可見的技術(shù)瑕疵,既沒有假發(fā)的元素,還直接讓主角自己戴上了太陽鏡。

      我們繼續(xù)在提示詞上加些難度,比如多人場景,并且要求人物的心情不同。

      海螺:

      可靈:

      Runway:

      令人驚喜的是,海螺巧妙地將另外一個人物虛化處理,區(qū)別前后景,并且兩個人的表情也截然不同。盡管在佩戴假發(fā)和太陽鏡動作處理上有些不自然,但總的來說控制住了多人物的場景。

      根據(jù)相同的提示詞,可靈生成的畫面有所欠缺,對于“女士”的表現(xiàn)只有隱約的長發(fā),人物面部表情、動態(tài)效果處理都有所欠缺。

      再看Runway,它無法生成兩個人物截然不同的面部表情,要笑一起笑,要戴眼鏡一起戴,頗有“榮辱與共”的生成使命感。

      另外,在人物鏡頭生成過程中,我們發(fā)現(xiàn)不同于Runway生成名人形象會得到違反內(nèi)容政策的提示,MiniMax在這一方面限制較少,比如可以生成帶點“老鐵味”的馬斯克。

      文字類

      測試下來,海螺在英文文字輸出方面也很成熟,并且還能一次性生成連續(xù)的鏡頭,改變畫面的明亮程度。

      Runway生成文字向來可圈可點,在動態(tài)效果表現(xiàn)上優(yōu)于海螺,但運鏡轉(zhuǎn)換上仍有提升空間。

      可靈目前還無法做到文字類鏡頭生成,對于“昏暗”的理解到位,畫面氛圍感十足,但英文文字完全錯誤。

      風景寫實類

      根據(jù)“AI新榜”此前多輪測試,大多數(shù)主流模型在風景寫實類鏡頭上表現(xiàn)都比較穩(wěn)定。這次挑戰(zhàn)的海螺、可靈和Runway在效果上也各有千秋。

      海螺:

      可靈:

      Runway:

      論真實性,沒有什么能夠比得過可靈。但可靈在地標建筑上稍有欠缺,背景并沒有體現(xiàn)上海、黃浦江等關(guān)鍵元素。

      海螺對于光影和背景處理更勝一籌,但生成的小黃鴨更有塑料感,沒有很好表現(xiàn)出提示詞中的“毛絨感”,更像一只玩具鴨。

      Runway生成的畫面直接采用特寫鏡頭,巧妙地解決了背景處理的問題。

      鏡頭運動

      鏡頭運動其實也涵蓋了各個視頻模型對于長文本的理解能力,我們投喂的提示詞如下:

      整體生成效果上,只有海螺達到了“鏡頭運動”的效果,并且沒有出現(xiàn)重影、崩壞等嚴重的畫面瑕疵。MiniMax前端開發(fā)佳心也在即刻平臺分享,加上更多鏡頭描述,比如“鏡頭跟隨(主體)”,畫面會更具電影感。

      只不過,提示詞要素過多,導致最終的人物僅是一閃而過,如果分段進行生成,能達到更好的畫面效果。

      可靈:

      Runway:

      總的來說,海螺AI對于提示詞的理解能力在線,生成的視頻內(nèi)容連貫性和可控性上把握得當。在微表情變化、運鏡表現(xiàn)上更細節(jié)、更具優(yōu)勢,甚至能夠很好刻畫出人物的情緒轉(zhuǎn)換。

      可以說,我們總希望的AI能有“人味兒”,MiniMax先淺淺往前跨了一小步。

      大家可以再直觀感受一下,海螺AI在“情緒表達”上的能力:

      值得一提的是,我們在嘗試過程中發(fā)現(xiàn),不少使用英文提示詞生成的畫面,明顯優(yōu)于中文提示詞生成的。比如,前文巨浪的畫面使用中文的效果是:

      還有同樣是讓嬰兒開摩托車:

      中文版:

      英文版:

      中文版完全沒有辦法理解“嬰兒”這一詞,但英文的“baby”就表現(xiàn)得很恰當。在中文提示詞下,人物表情扭曲、畫面崩壞的問題會更加明顯,在真實感上會有所欠缺。

      在測試過程中,除了中英文提示詞效果不同外,我們也遇到了其他問題,剩了不少廢片。比如,它默認生成的歐美面孔偏多,缺少國風元素。和其他工具一樣,如果追求高質(zhì)量的畫面,海螺AI就避免不了“抽卡”的環(huán)節(jié)。

      另外,海螺AI暫不支持并行生成多個視頻,無法調(diào)整畫面比例,這在一定程度上也限制了視頻內(nèi)容的再創(chuàng)作。

      不過,MiniMax創(chuàng)始人閆俊杰在接受多家媒體采訪時提前預告稱,未來產(chǎn)品會迭代圖生視頻功能,增加視頻可控制、可編輯等功能。未來幾周內(nèi),MiniMax還會發(fā)布從速度和效果上都對標GPT-4o的大模型abab7。

      國產(chǎn)大模型加速趕超,MiniMax能否脫穎而出

      短短幾個月,文生視頻的競爭已然走向白熱化。

      AI視頻生成在畫面流暢度、物理世界模擬、長文本理解等方面都有顯著的提升,早已褪去切片式“動態(tài)PPT”的效果,轉(zhuǎn)變成可使用的創(chuàng)作工具。

      且不說海外的Runway、Luma、Pika,近半年內(nèi)國內(nèi)就出現(xiàn)了可靈、清影、Vidu等視頻生成工具,一時讓人抉擇不出哪家效果最好。

      此前,“AI新榜”對10家國內(nèi)外熱門的AI視頻生成工具進行過實測盤點,感興趣的玩家可移步閱讀。(相關(guān)閱讀:《可靈制作短片驚艷馬斯克,所以最好用的AI視頻工具究竟是誰?》)

      結(jié)合我們此前的實測和玩家反饋,幾家AI視頻產(chǎn)品各有特色。

      就國內(nèi)來看,可靈在國風元素、對物理世界理解上具有獨特優(yōu)勢,所以生成畫面更具備真實感;生數(shù)科技的Vidu生成耗時短;即夢是幾家中綜合性價比較高的一款工具。

      國外,Runway Gen-3在長文本語義理解上躍升了新臺階;Luma Dream Machine在動幅和想象力上十分出色,因此網(wǎng)友大多用它來玩梗造梗。

      MiniMax的海螺AI在人物細節(jié)和情緒表現(xiàn)上找到了自己的賽道。這一特點也讓海螺AI吸引了海內(nèi)外創(chuàng)作者對視頻生成的又一輪創(chuàng)作熱情。

      比如,博主“Lepadphone”用19個哭泣相關(guān)的提示詞,讓海螺AI生成了一組視頻。

      來源:視頻號用戶“Lepadphone”

      “Min Choi”的視頻展現(xiàn)了多人物場景,該視頻在X平臺上獲贊2.8萬。

      在此前MiniMax伙伴日活動上,閆俊杰提到,MiniMax一直在解決視頻生成的穩(wěn)定性等難題,讓模型的輸入輸出盡可能長,讓AI更進一步像人。之前基于文本的底層基礎(chǔ)設(shè)施,處理清洗數(shù)據(jù)、標注等等都不太適用視頻,因為視頻是千萬token的輸入和輸出,天然具備復雜性。

      礙于技術(shù)層面上的多重挑戰(zhàn),MiniMax入局AI視頻,顯得有些姍姍來遲。

      最初,“海螺AI”其實是一款類ChatGPT的AI助手,早前被人熟知是因為它的聲音克隆功能,超擬人的音效營造了和真人聊天的情境,吸引了不少網(wǎng)友和它互動聊天。

      在語音大模型、文本對話上具有明顯優(yōu)勢的Minimax,卷起了視頻生成。海螺AI的網(wǎng)頁端上,我們可以看到搭載了創(chuàng)作音樂、創(chuàng)作視頻、對話搜索等新能力。

      用戶甚至可以一站式完成文本到有聲音的視頻。MiniMax背后的abab-music和abab-video模型,使得這一直出工作流成為可能。

      閆俊杰在最新的分享中稱,人類大部分的交流在多模態(tài)里。本質(zhì)上純文字信息占比少,更多的是通過圖文、短視頻等信息交流,甚至購物也都是圖片為主。所以為了用戶的覆蓋度和使用度,能夠輸出動態(tài)內(nèi)容是更核心、更重要的。

      這可能也是今年AI視頻應用爆發(fā)的原因之一,從大廠到初創(chuàng)公司,國內(nèi)外眾多企業(yè)紛紛加入到這場技術(shù)競賽中,一時間視頻生成賽道顯得十分擁擠且激烈。

      技術(shù)層面上,各家開始卷起了視頻控制功能、確保內(nèi)容連貫性和質(zhì)量。近期,快手可靈面向超級創(chuàng)作者內(nèi)測了1.5版本以及運動筆刷功能,旨在進一步提升視頻畫面的可控性。

      AI視頻模型的落地,已經(jīng)不僅僅是技術(shù)上的較量。另一方面,在國內(nèi)大模型To C產(chǎn)品免費為主的情況下,AI視頻生成工具大多開啟了付費訂閱模式,快手可靈、字節(jié)即夢、智譜清影陸續(xù)上線了會員體系。

      此前,AI視頻創(chuàng)作者Abel Art曾估計,1分鐘連貫的視頻比例約為500個視頻片段,用現(xiàn)有AI工具制作1分鐘視頻的成本大約在125美元(約890元人民幣),相當于租借電影鏡頭一天。

      這僅僅是個人創(chuàng)作者的算力和資金消耗,在這樣的背景下,高算力需求和推理成本還能讓MiniMax限時免費多久?

      閆俊杰談及大家關(guān)注的商業(yè)化問題,還是很謹慎。他提到:“最重要的東西還不是商業(yè)化,是提高AI產(chǎn)品在用戶中的滲透率,比如說海螺打磨出新的功能,直到有用戶粘性,是真正地讓技術(shù)到達廣泛可用的程度?!?/p>

      以上就是關(guān)于【試了試MiniMax新出的Al視頻模型,發(fā)現(xiàn)它生成人物的“演技”吊打內(nèi)娛】的相關(guān)內(nèi)容,希望對大家有幫助!

      免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

      熱點推薦

      精選文章