快手「可靈」再進化!視頻續(xù)寫可達3分鐘讓全球網(wǎng)友炸鍋
相信很多大家對快手「可靈」再進化!視頻續(xù)寫可達3分鐘讓全球網(wǎng)友炸鍋還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
【新智元導讀】沒想到,剛剛上線了圖生視頻和視頻續(xù)寫功能的可靈AI,竟已在全世界互聯(lián)網(wǎng)上引爆了視頻創(chuàng)作的熱潮!
最近,可靈AI直接讓一位網(wǎng)友的家人群里炸鍋了……
事情是這樣的,這位網(wǎng)友的父親需要做搭橋手術,為了給父親鼓舞,他便試著用可靈AI把爺爺?shù)膬蓮埨险掌€原成了視頻。
在下面這個視頻中,爺爺正在朝鮮戰(zhàn)場,擔任營指導員。穿越時光隧道,1950年代風華正茂的爺爺,對著他揮了揮手。
這位網(wǎng)友把視頻發(fā)到家人群后,群里直接炸了!
下面這張黑白的合影,是全家唯有的一張全家福。
當已經(jīng)故去的人忽然動了起來,音容笑貌一如往昔,每個人都淚目了。
家人們久久不能平靜,即使已過午夜,群里仍然不斷有消息響起。
用AI還原老照片后,全家人仿佛一起經(jīng)歷了一場尋根之旅,從長輩口述的「家史」中,每個人都獲得了更多的自我身份認同感。
網(wǎng)友「玨哥」在他的公眾號「覺得有意思」里表示,在他看來,AI最大的意義就是成為一臺超級造夢機器:安排自己做個美夢,一覺醒來就有繼續(xù)去生活的勁頭了。
歪果仁都「饞哭了」
是的,這幾天快手可靈最新上線的圖生視頻和視頻續(xù)寫功能,不僅在國內掀起一波試用的熱潮,還「饞哭」了一眾外國網(wǎng)友。
如今,X上已經(jīng)鋪滿了可靈生成和續(xù)寫的視頻。
比如這張著名的經(jīng)典表情包,經(jīng)過可靈的續(xù)寫后終于有了大結局!
每一步都在意料之外,但似乎又在情理之中(手動狗頭)
狗狗吃面也變得活靈活現(xiàn)。
要知道,曾經(jīng)的快手可靈一出世,就讓外國網(wǎng)友們發(fā)出心悅誠服的感嘆:效果居然比Sora還要好!
同樣是吃漢堡,可靈生成的「咬痕」就要比Sora更加逼真
一些申請到試用資格的用戶紛紛表示「真香」。而那些不能親自體驗的國外網(wǎng)友,紛紛「跪求」幫忙生成。
可以說,可靈給全世界的開發(fā)者們,再次帶來了來自中國的億點點震撼!
作者:溫維斯Wenvis
值得一提的是,由于太過爆火,快影App截至目前已有累計超過20萬人排隊申請。
所以說,這次可靈的兩大全新功能,究竟強大在哪里?
圖生視頻
首先來看第一個功能——圖生視頻。
這一功能直接做到了化靜為動,讓我們從此可以按需定制視覺敘事。
可靈在文生視頻上的諸多強大功能,也被一一完美融入了,比如創(chuàng)造逼真的運動場景、精確模擬物理特性、將復雜概念巧妙融合、輸出電影級畫質、自由調節(jié)視頻縱橫比等等。
上傳一張圖片,接下來,就是奇跡出現(xiàn)的時刻。
永遠面帶謎之微笑的蒙娜麗莎,竟然戴上了墨鏡,瞟向觀眾們的小眼神,更多了一絲調皮和狡黠。
prompt:蒙娜麗莎用手戴了眼鏡
構建復雜時空一絕業(yè)內都知道,模型在轉換靜態(tài)圖像為動態(tài)視頻時,如何細膩而準確地實現(xiàn)大幅度運動場景,要克服不少難點。
對此,可靈充分利用了基礎模型架構中的3D時空聯(lián)合注意力機制,在構建復雜時空運動方面,表現(xiàn)令人驚嘆。
下面這個由靜圖生成的牧羊犬追球的視頻,自然流暢,效果非常絲滑。
無論是牧羊犬一下一下晃動的耳朵,還是隨風飄揚的毛發(fā),看起來都很符合物理規(guī)律。
prompt:可愛的牧羊犬在奔跑,網(wǎng)球在彈跳,溫馨的氛圍
汽車在公路上飛馳的這段視頻,可靈對整體畫面的處理效果簡直堪稱廣告級大片。
不僅汽車疾速前行的姿態(tài)逼真自然,對向車道上接連不斷的車流、道路兩旁向后掠去的樹木、虛化處理的隔離帶,無不模擬出了疾馳的速度感,幾乎挑不出破綻。
prompt:汽車在公路上高速行駛,速度感,廣告片
文本指令控制視頻,女孩一鍵轉身更厲害的是,可靈的圖生視頻模型還融入了強大的提示詞融合技術。
這就意味著,用戶可以對模型下達文本指令,來人為地掌控視頻中對象的動態(tài)表現(xiàn)了。
比如上傳這張女孩的照片后,普通的模型,可能會默認增加發(fā)絲飄動、花朵搖曳、水面閃爍波紋的效果。
但在可靈中,我們可以輸入「轉身背對鏡頭」的提示詞。
模型輸出的視頻中,女孩就開始優(yōu)雅轉身,并且增添了轉身瞬間微笑、眨眼的細節(jié),顯得更加自然生動。
可靈的這個新功能,也讓我們的想象力可以充分放飛。
比如小編在看《權力的游戲》時經(jīng)常想象的一個場景——「憤怒的巨龍,漫天飛沙,奇幻風格電影」,提示詞輸入后,幻想中的場景瞬間成真了!
巨龍昂首展翅,掀起漫天黃沙,咆哮聲震耳欲聾
這種文本與圖像意義的緊密聯(lián)動,無疑對影視制作等行業(yè)意義重大。(看來好萊塢導演撤掉8億美元攝影棚,的確是明智的選擇)
從此,視覺敘事可以按需定制,許多行業(yè)必將掀起新的颶風。
此外,這個模型還能支持不同風格的圖像輸入,無論自然寫實,還是風格化圖像。
同時,它還兼容各種長寬比的圖像輸入,可以說是為國內各個短視頻平臺量身打造。
這張豎版的騎士,黑袍飛舞,光劍仙氣環(huán)繞,氛圍感瞬間拉滿
實測效果憑AI電影《山海奇境》刷屏全網(wǎng)的制作人陳坤,半年之后用可靈的圖生視頻功能重制了一遍《山海奇鏡》的預告片。
留言區(qū)的網(wǎng)友直呼「有大片的味道」。果然AI一天,人間一年。
可靈AI,贊52
這位叫「海軍愛攝影」的網(wǎng)友,直接將自己的攝影作品變成了視頻。
奔跑的女孩與駱駝,黑白的色調,顆粒的老電影質感,把攝影作品中包含壓迫感的內涵意蘊升華到了令人震撼的地步。
可靈AI,贊451
當世界名畫開始動起來,會給人怎樣的體驗?
「JessyJang」用可靈讓我們大開眼界。
無論是現(xiàn)代藝術的經(jīng)典之作《The Son of Man》,還是著名油畫《戴珍珠耳環(huán)的少女》《吹笛少年》,都忽然開始活靈活現(xiàn)。霍格沃茨城堡上的油畫,原來是真實存在的?
可靈AI,贊78
B站up主「嗚哩智繪」,用可靈的圖生視頻功能,生成了各個樣子的戴珍珠耳環(huán)的少女。
人物動作、面部表情、手部細節(jié)、視頻中的光影,都堪稱完美。
「嗚哩智繪」直言:這是「目前我玩過的最穩(wěn)定好用的圖生視頻」。
網(wǎng)友也表示——
「喜好兒網(wǎng)」則用可靈讓歷史人物活了起來。
網(wǎng)友們驚呼,可靈做出的愛因斯坦簡直跟紀錄片一樣。
up主「鑫訫向榮」直接把語文課本里的插畫都還原了出來。還記得這些都是哪一課嗎?
up主「花染色體TT」,干脆用可靈做了個「偽log」。
用幾張12年前的照片,讓記憶中的場面鮮活起來。此時,距離高考還有16天——
美女的照片,變成視頻后美得更有沖擊力了。
即使混進了一些奇怪的東西,看起來似乎也很自然。
視頻續(xù)寫
其次,是對算法挑戰(zhàn)更大的「視頻續(xù)寫」。
它不僅要求模型理解視頻的基本元素,以及更深層次的敘事結構,還需要創(chuàng)建新的情景,而且在視覺和主題上都要保持連貫。
在這一領域,可靈則成功地把強大的想象力和精細的可控性發(fā)揮得淋漓盡致。
隨著功能的正式上線,所有視頻立刻在原有基礎上原地「+5秒」!
無論是文生視頻還是圖生視頻,皆可適用。
這對于創(chuàng)作者來說,視頻續(xù)寫至關重要。因為這種強大的敘事能力,可以極大地拓展他們的創(chuàng)作邊界。
無獨有偶,Runway的Gen-2可支持將視頻時間最高延續(xù)到18秒,每次點擊「Extend」功能,可完成4秒的視頻,而且能夠保持人物的一致性。
同樣,Pika也支持視頻延續(xù)的功能,而且用戶可以指定想要生成的時間,與原始視頻無縫集成。
而上周,初創(chuàng)公司Luma AI發(fā)布的AI視頻模型Dream Machine,直接就定位為「續(xù)寫模型」,還能免費試玩。
各種表情包,成為網(wǎng)友們惡搞的對象,經(jīng)過Dream Machine的想象,所有的靜圖都有了完美的后續(xù)。
可見,視頻續(xù)寫代表著整個AI視頻模型發(fā)展未來,打破了傳統(tǒng)視頻編輯的界限。
多次續(xù)寫,最長可達3分鐘更矚目的是,可靈大模型甚至還能連續(xù)多次續(xù)寫,這樣的結果就是,我們最長能夠生成長達約3分鐘的連貫視頻!
續(xù)寫x1:一個女人站在雪地里,抬起右手摸了一下帽檐
續(xù)寫x2:女人的手放下,并望向遠方
深刻理解物理世界,合理且大幅度動作無破綻可以看出,新生成的部分和原視頻之間,依然保持著運動連貫性和物理的合理性,這正是基于可靈大模型對于物理運動的深入理解。
而這種續(xù)寫,就給巧妙融入大幅度動作變化帶來了可能,讓視頻的生動性大大提高。
續(xù)寫x1:宇航員從月球表面跳起來,飛向太空
同樣,在視頻續(xù)寫中也集成了文本控制機制,因此用戶可以通過自定義提示詞,為每段視頻注入個性化的創(chuàng)意。
由此,我們想要的每次場景都可以平滑過渡,可以說是不放過咱們都任何一個靈感小火花!
文本控制續(xù)寫,場景轉換絲滑比如這座古堡,我們既可以在場景中讓「太陽落下,天空變暗,燈光漸亮」,隨后讓「燈光亮起,霧氣氤氳」。
實測效果而網(wǎng)友們用續(xù)寫功能做出來的視頻,效果簡直一個比一個炸裂!
網(wǎng)友「石碩Simon」直接用可靈的續(xù)寫功能創(chuàng)作了長達1分多鐘的一鏡到底。
多次續(xù)寫的鏡頭,依然保持著令人叫絕的連貫性。
「PlayerKang」生成的59秒奔馳汽車大片,無論在連續(xù)性、穩(wěn)定性和流暢性上都令人叫絕,已經(jīng)接近了替代商業(yè)廣告片的水平。
「西地宇宙CDVERSE」用可靈的視頻續(xù)寫功能,做出了一套古香古韻的「日出東方」大片。
整個視頻,是用一張圖片生成的長鏡頭。
每個鏡頭中的人物,始終保持著穩(wěn)定。
技術積累
此次進化,可靈文生視頻基礎大模型被無縫整合到「圖生視頻」和「視頻續(xù)寫」功能中,帶來了更豐富、靈活的視頻創(chuàng)作體驗。
這些能力,都基于快手在AI大模型時代的不斷布局。
快手先后發(fā)布了,通用大語言模型「快意」,文生圖大模型「可圖」,還有Direct-a-Video、Video-LaVIT、I2V-Adapter、UNIAA等視頻生成關鍵技術。
恰逢近日在美國西雅圖舉行的國際計算機視覺頂會CVPR2024上,快手也同步發(fā)布了可靈大模型的圖生視頻和視頻續(xù)寫等最新功能,引起現(xiàn)場的強烈反響。
公開資料顯示,今年快手共有8篇論文入選CVPR2024,彰顯了其在該領域的深厚研究功底。
除了憑借創(chuàng)新的技術在CVPR上大放異彩之外,作為一家引領行業(yè)發(fā)展的公司,還要用戰(zhàn)略眼光將技術落地到應用。
就在即將開幕的2024世界人工智能大會(WAIC)上,快手將舉辦以「新AI·新應用·新生態(tài)」為主題的大模型技術生態(tài)論壇。
屆時,不僅會發(fā)布最新的大模型技術,還包括快手大模型技術矩陣全景、應用和落地現(xiàn)狀等一系列多維度、多方向的戰(zhàn)略討論。
以上就是關于【快手「可靈」再進化!視頻續(xù)寫可達3分鐘讓全球網(wǎng)友炸鍋】的相關內容,希望對大家有幫助!
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!
-
奔馳GLE作為豪華SUV市場中的佼佼者,憑借其卓越的性能、豪華的內飾以及寬敞的空間,吸引了眾多消費者的關注。...瀏覽全文>>
-
在2025年,安徽阜陽地區(qū)的帕薩特新能源汽車市場表現(xiàn)非?;钴S。作為一款備受關注的新能源車型,帕薩特新能源憑...瀏覽全文>>
-
近日,滁州地區(qū)的大眾汽車經(jīng)銷商傳來好消息:備受矚目的2025款T-ROC探歌正式上市,并且以極具競爭力的價格吸引...瀏覽全文>>
-
在選擇一款新能源汽車時,了解其價格和配置是非常重要的一步。安徽淮南地區(qū)的長安啟源E07作為2024款的新車型,...瀏覽全文>>
-
阜陽長安啟源A05作為長安汽車旗下的全新車型,自推出以來便憑借其獨特的設計風格和豐富的配置吸引了眾多消費者...瀏覽全文>>
-
阜陽長安啟源A07作為一款備受矚目的新能源車型,以其豪華配置和親民的價格在市場上引起了廣泛關注。這款車型不...瀏覽全文>>
-
安徽淮南威然2024款價格及配置詳解隨著汽車市場的不斷更新?lián)Q代,上汽大眾旗下的MPV車型——威然(Viloran)憑...瀏覽全文>>
-
QQ多米新車報價2025款,買車省錢秘籍隨著汽車市場的不斷發(fā)展,消費者在選購車輛時不僅關注車型的性能和配置,...瀏覽全文>>
-
滁州途觀X 2024款最新價格及買車省錢秘籍隨著汽車市場的不斷發(fā)展,大眾途觀X作為一款兼具時尚與性能的中型SUV...瀏覽全文>>
-
隨著汽車市場的不斷發(fā)展,大眾蔚攬以其優(yōu)雅的設計和卓越的性能贏得了眾多消費者的青睞。作為一款兼具實用性和...瀏覽全文>>
- Nvidia DLSS 4 有望將游戲性能提高 8 倍
- 人工智能在預測自身免疫性疾病進展方面顯示出良好的前景
- 心理物理實驗揭示皮膚水分感知是如何改變的
- 科茨沃爾德公司慶祝圣誕節(jié)圓滿成功
- 南法納姆學校被評為薩里郡表現(xiàn)最好的小學
- 約克區(qū)九所小學將削減招生人數(shù)
- 松下新款電動汽車電池為 Lucid Gravity 帶來 450 英里續(xù)航里程
- 泰國旅游呈現(xiàn)新趨勢
- 研究人員找到在細胞水平上餓死前列腺癌腫瘤的新方法
- 領先的人工智能聊天機器人在測試中表現(xiàn)出類似癡呆癥的認知能力下降
- 龐大的 Project Zomboid build 42 終于可以玩了
- Steam Replay 回歸向您展示 2024 年您玩得最多的 PC 游戲
- Jollyes 推出強化的人才支持和招聘措施
- Karen Millen 與 Simon Harrison 共同推出全新高級珠寶系列
- 奇瑞風云A8L電動轎車刷新續(xù)航里程世界紀錄
- 虛擬藝術家將別克 Cascada 帶回 2026 款車型
- OnePlus 宣布推出新計劃解決綠線問題
- OnePlus Watch 3 將擁有更大的電池和更薄的機身
- 研究人員發(fā)現(xiàn)可變剪接與自身免疫性疾病遺傳之間的細胞類型特異性聯(lián)系
- 科學家確定腦細胞類型是排尿的主要控制者