超5萬(wàn)人排隊(duì)內(nèi)測(cè)!海內(nèi)外爆火的“中國(guó)版Sora”驚艷全場(chǎng),真這么好用?| AI評(píng)測(cè)
相信很多大家對(duì)超5萬(wàn)人排隊(duì)內(nèi)測(cè)!海內(nèi)外爆火的“中國(guó)版Sora”驚艷全場(chǎng),真這么好用?| AI評(píng)測(cè)還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
誰(shuí)能想到,現(xiàn)在外網(wǎng)最搶手的AI視頻生成模型,不是Sora,也不是Runway或Pika,而是國(guó)產(chǎn)大模型“Kling(可靈)”。
可靈視頻合集在X平臺(tái)上獲得數(shù)百萬(wàn)瀏覽量
由于生成視頻效果驚艷,可靈在國(guó)外獲得了“中國(guó)版Sora”“Sora殺手”等稱號(hào)。
除了拿可靈與Sora進(jìn)行比較,不少國(guó)外網(wǎng)友為了用上可靈,不僅以發(fā)中文、制作表情包等形式花式求號(hào),而且由于不認(rèn)識(shí)中文,獲得了測(cè)試權(quán)限的AI藝術(shù)家、X博主“Dustin Hollywood”表示自己是通過(guò)辨識(shí)圖標(biāo)來(lái)學(xué)習(xí)操作可靈,并直呼“玩到手機(jī)發(fā)燙”。
苦等Sora許久的國(guó)外網(wǎng)友,還寄希望于可靈的爆火能夠倒逼OpenAI開放Sora訪問(wèn)權(quán)限。
這款被國(guó)外網(wǎng)友予以重任的“中國(guó)版Sora”——可靈大模型,由快手AI團(tuán)隊(duì)自研,是首個(gè)Sora級(jí)面向用戶開放的文生視頻大模型。
據(jù)可靈官網(wǎng)顯示,該模型不僅采用了類Sora的技術(shù)路線,還融入了多項(xiàng)自研技術(shù),能夠生成長(zhǎng)達(dá)2分鐘、30fps的1080p高分辨率視頻,并且支持多種寬高比。
同時(shí),與Sora一樣,能夠模擬真實(shí)物理世界,生成具有大幅度合理運(yùn)動(dòng)的視頻。
官網(wǎng)地址:https://kling.kuaishou.com/
目前,可靈已登陸快手旗下視頻剪輯工具快影App,開放邀請(qǐng)測(cè)試。只需下載應(yīng)用,在主頁(yè)找到“AI創(chuàng)作”點(diǎn)擊進(jìn)入,找到“AI生視頻”即可申請(qǐng)內(nèi)測(cè)。
可靈爆火出圈,有消息稱已經(jīng)火到排隊(duì)內(nèi)測(cè)人數(shù)已超5萬(wàn)。我們拿到測(cè)試資格后,第一時(shí)間對(duì)可靈和Sora進(jìn)行了一番對(duì)比測(cè)試。
實(shí)測(cè)過(guò)程中,我們發(fā)現(xiàn)可靈在多種類型視頻生成上相比Sora展現(xiàn)出顯著優(yōu)勢(shì)。此外,測(cè)試過(guò)程中也遇到了一些問(wèn)題,并通過(guò)獨(dú)家渠道得到了部分問(wèn)題的解答。
對(duì)標(biāo)Sora,可靈有多能打?
盡管Sora目前尚未開放測(cè)試,但官方已經(jīng)發(fā)布了一些測(cè)試案例,并為它們提供了相應(yīng)的提示詞。
基于這些信息,我們對(duì)可靈和Sora生成的視頻進(jìn)行了對(duì)比分析。
動(dòng)物類鏡頭
可靈:
Sora:
在沒有提示詞要求的情況下,可靈和Sora都傾向于生成寫實(shí)風(fēng)格的視頻。不同的是,可靈在生成視頻時(shí)并未遵循文字提示中的具體動(dòng)作——“下棋”,而是展現(xiàn)了猴子拿著一張紙的場(chǎng)景。
與Sora相比,可靈這輪生成的視頻出現(xiàn)了肉眼可見的技術(shù)瑕疵。例如,視頻中當(dāng)猴子轉(zhuǎn)頭時(shí),眼部出現(xiàn)了重影。
不過(guò),令人驚喜的是,我們將Sora一個(gè)翻車視頻的提示詞投喂給可靈后,最終生成的視頻在手機(jī)上的觀看效果相當(dāng)不錯(cuò)
可靈:
AI視頻生成會(huì)在物理方面遇到困難,尤其是運(yùn)動(dòng)主體移動(dòng)時(shí)的腿部動(dòng)作容易“露怯”。
早前Sora生成的視頻是側(cè)面視角,所以觀眾可以明顯地察覺到狗狗在行走時(shí)腿部的不自然交叉。而可靈生成的鏡頭,通過(guò)讓畫面主體從景深處走向鏡頭的方式,巧妙地避免了這一問(wèn)題。
人物類鏡頭
可靈:
Sora:
這條視頻是Sora當(dāng)時(shí)頗為出圈的一條視頻。根據(jù)相同的提示詞,可靈生成的女性形象基本符合要求,但明顯的問(wèn)題在于人物面部在動(dòng)態(tài)效果中的處理有所欠缺。
超現(xiàn)實(shí)鏡頭
可靈:
Sora:
可靈這輪沒有遵循提示詞要求生成一只由樹葉構(gòu)成的大象,導(dǎo)致畫面缺少了Sora視頻中那種超現(xiàn)實(shí)與寫實(shí)相結(jié)合的效果。與其他創(chuàng)作者的反饋類似,可靈在想象力方面的表現(xiàn)比較“中規(guī)中矩”。
風(fēng)景類鏡頭
可靈:
Sora:
風(fēng)景類鏡頭上,可靈和Sora在整體表現(xiàn)上各有千秋,沒有明顯的差異。我們讓GPT-4o根據(jù)靜態(tài)圖像,對(duì)兩個(gè)視頻的構(gòu)圖、色彩進(jìn)行了專業(yè)點(diǎn)評(píng):
實(shí)測(cè)下來(lái),可靈仍然存在AI視頻模型的通病,在人物行走、人物面部表情的處理上顯得不夠自然,以及在場(chǎng)景的真實(shí)感和動(dòng)態(tài)連貫性方面還有提升空間。
雖然生成的視頻在手機(jī)端的小屏幕觀看時(shí)表現(xiàn)尚可,但在大屏幕(如電腦端)上觀看時(shí),人物面部表情扭曲,動(dòng)作僵硬等問(wèn)題會(huì)更加明顯,多少還是有些“詭異”感。
但整體而言,不知道屏幕前的玩家是否有相同感受,可靈生成的視頻更有“中國(guó)味兒”,且在寫實(shí)風(fēng)格上對(duì)真實(shí)世界還原度很高。
尤其在涉及國(guó)風(fēng)元素、亞洲面孔以及現(xiàn)實(shí)生活場(chǎng)景的鏡頭表現(xiàn)上,相比海外模型,可靈能夠更準(zhǔn)確地生成富有中國(guó)文化特色的鏡頭。
下面這些鏡頭都由可靈生成,自帶濃濃的“老鐵味兒”,這下誰(shuí)能分得清快手和可靈啊。
提示詞:端午節(jié)日氣氛的街道
提示詞:端午節(jié)日氣氛,賽龍舟
需要說(shuō)明的是,本文測(cè)試環(huán)節(jié)所展示的可靈鏡頭均為直出,并沒有多次“抽卡”。而Sora的測(cè)試鏡頭則來(lái)源于官方發(fā)布的內(nèi)容。因此,這兩者之間的對(duì)比僅供讀者參考,以提供一個(gè)直觀的比較視角。
在測(cè)試過(guò)程中,我們和其他創(chuàng)作者一樣也遇到一些問(wèn)題。例如,據(jù)稱可靈能夠生成長(zhǎng)達(dá)2分鐘的1080p高清視頻。經(jīng)實(shí)測(cè)目前開放版本僅支持720P、5秒視頻生成。
我們從快手官方獲悉,目前一鍵生成2分鐘時(shí)長(zhǎng)的視頻功能尚未對(duì)用戶開放,會(huì)盡快推出。
由于可靈搭載在快影App上,整合了一系列視頻創(chuàng)作功能。用戶生成的視頻可以通過(guò)點(diǎn)擊界面右上角的“去剪輯”按鈕,進(jìn)行下一步視頻處理,如提升分辨率、改變畫幅比例等,對(duì)整個(gè)視頻創(chuàng)作工作流來(lái)說(shuō)相當(dāng)絲滑。
此外,用戶還可以一鍵將處理好的視頻發(fā)布到快手平臺(tái),從創(chuàng)作到分享,“自產(chǎn)自銷”形成完整閉環(huán)。
國(guó)產(chǎn)視頻大模型加速追趕,
快手帶動(dòng)新一輪AI視頻創(chuàng)作潮
Sora爆火后,國(guó)產(chǎn)類Sora視頻大模型紛紛涌現(xiàn),引發(fā)行業(yè)熱烈討論和高度關(guān)注。
從學(xué)界到業(yè)界,從大廠到初創(chuàng)公司,國(guó)內(nèi)眾多科技公司和研究機(jī)構(gòu)紛紛加入到新一輪視頻生成技術(shù)競(jìng)賽中,一時(shí)間誰(shuí)是“中國(guó)版Sora”的競(jìng)爭(zhēng)變得尤為激烈。
如清華大學(xué)聯(lián)合生數(shù)科技發(fā)布的“Vidu”,號(hào)稱是中國(guó)首個(gè)長(zhǎng)時(shí)長(zhǎng)、高一致性、高動(dòng)態(tài)性視頻大模型。近期官宣迎來(lái)新一輪技術(shù)迭代,支持一鍵生成32秒視頻和音視頻合成。
同一時(shí)期,世界模型公司“極佳科技”聯(lián)合清華大學(xué)自動(dòng)化系發(fā)布模型原生16秒時(shí)長(zhǎng)、端側(cè)可用的Sora級(jí)視頻生成大模型“視界一粟 YiSu”。
快手可靈正是在這背景下推出并在海內(nèi)外爆火的。
與其他模型相比,快手可靈不是預(yù)發(fā)布、也不是官方演示合集,而是直接面向公眾開放測(cè)試的產(chǎn)品級(jí)應(yīng)用。發(fā)布即上線吸引了不少創(chuàng)作者、AI愛好者關(guān)注試玩,由此引發(fā)的二次傳播,為其海內(nèi)外爆火貢獻(xiàn)了重要力量。
可靈AI,贊153
復(fù)刻Sora短片《氣球人》,來(lái)自可靈首批創(chuàng)作者@溫維斯Wenvis
可靈AI,贊628
當(dāng)動(dòng)物音樂(lè)團(tuán)演奏周杰倫,來(lái)自可靈首批創(chuàng)作者@煉丹師忠忠
可以說(shuō),可靈的出現(xiàn)甚至促進(jìn)了海外對(duì)AI視頻生成的新一輪討論和創(chuàng)作熱情。
為了找可靈代餐,X上不少AI圈博主收到消息稱,海外即將上線一款比可靈更好的AI視頻模型。
目前,該模型已經(jīng)官宣,是Luma推出AI視頻生成模型Dream Machine。(接下來(lái)我們將第一時(shí)間進(jìn)行實(shí)測(cè),敬請(qǐng)關(guān)注。)
AI視頻方面,快手入局并不算早。
抖音的AI視頻產(chǎn)品“即夢(mèng)”已于2個(gè)月前正式推出。
兩家公司同處短視頻賽道,旗下AI視頻產(chǎn)品如何與平臺(tái)內(nèi)容生態(tài)有效聯(lián)動(dòng),將成為行業(yè)未來(lái)長(zhǎng)期關(guān)注的焦點(diǎn)。
AI視頻生成技術(shù)的發(fā)展和應(yīng)用也面臨多重挑戰(zhàn)。
技術(shù)層面上,提升視頻生成質(zhì)量和效率、確保內(nèi)容連貫性和一致性是亟待解決的關(guān)鍵問(wèn)題。
同時(shí),高算力需求和昂貴的推理成本也是限制其商業(yè)化的主要障礙。
在這樣的背景下,AI視頻模型的落地應(yīng)用已經(jīng)不僅僅是技術(shù)層面的較量。無(wú)論是大廠還是初創(chuàng)公司,都是對(duì)其內(nèi)容生態(tài)構(gòu)建、商業(yè)模式創(chuàng)新和成本控制能力的全方位考驗(yàn)。
以上就是關(guān)于【超5萬(wàn)人排隊(duì)內(nèi)測(cè)!海內(nèi)外爆火的“中國(guó)版Sora”驚艷全場(chǎng),真這么好用?| AI評(píng)測(cè)】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!