阿里中科大合推虛擬試衣技術(shù)ViViD 輕松實(shí)現(xiàn)視頻換衣
相信很多大家對(duì)阿里中科大合推虛擬試衣技術(shù)ViViD 輕松實(shí)現(xiàn)視頻換衣還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
5月31日 消息:阿里巴巴與中國科學(xué)技術(shù)大學(xué)聯(lián)手推出了一款名為ViViD的新框架,旨在革新虛擬試衣體驗(yàn)。ViViD基于先進(jìn)的擴(kuò)散模型技術(shù),能夠?qū)崿F(xiàn)視頻中人物衣物的實(shí)時(shí)替換,從而生成自然且逼真的視頻效果。
ViViD的推出解決了以往視頻試衣中難以保持時(shí)間一致性和圖像質(zhì)量的難題。它由三大核心組件構(gòu)成:服裝編碼器、姿勢(shì)編碼器以及時(shí)間模塊。這些組件協(xié)同工作,不僅可以精確提取衣物細(xì)節(jié)的語義特征,還能對(duì)人物姿勢(shì)進(jìn)行編碼,并確保整個(gè)視頻在時(shí)間線上的連貫性。
為了進(jìn)一步提升試衣效果,研究團(tuán)隊(duì)還引入了一種創(chuàng)新的注意力特征融合機(jī)制。這種機(jī)制優(yōu)化了衣物語義信息的整合過程,使得最終呈現(xiàn)的試衣效果更加貼合用戶的多樣化需求。無論是上半身、下半身還是連衣裙等不同類型的服裝,ViViD都能夠輕松應(yīng)對(duì),展現(xiàn)出其強(qiáng)大的適應(yīng)性。
視頻來自官方項(xiàng)目頁
在實(shí)驗(yàn)測(cè)試中,ViViD展現(xiàn)出了令人矚目的性能。與其他現(xiàn)有方法相比,它在視覺質(zhì)量、時(shí)間一致性以及細(xì)節(jié)保持方面都取得了顯著優(yōu)勢(shì)。實(shí)際演示中,用戶可以選擇單獨(dú)更換上衣或褲子,或者同時(shí)替換兩者,這種靈活的選擇極大地豐富了用戶體驗(yàn)。
為了全面評(píng)估ViViD的性能,阿里和中科大的研究團(tuán)隊(duì)投入了大量資源構(gòu)建了一個(gè)專門的數(shù)據(jù)集,命名為ViViD數(shù)據(jù)集。這個(gè)數(shù)據(jù)集包含了高達(dá)9700個(gè)服裝視頻對(duì),分辨率高達(dá)832×624,是目前公開數(shù)據(jù)中規(guī)模最大、多樣性最高且分辨率最清晰的視頻虛擬試衣數(shù)據(jù)集。
ViViD的問世不僅是人工智能領(lǐng)域的一項(xiàng)技術(shù)突破,更是虛擬試衣技術(shù)邁向?qū)嵱没闹匾徊?。隨著這一新框架的推廣和應(yīng)用,未來消費(fèi)者在線上購物時(shí)將能享受到更加便捷、直觀的試衣新體驗(yàn),為零售商和電商企業(yè)帶來新的增長(zhǎng)機(jī)遇。
項(xiàng)目頁:https://becauseimbatman0.github.io/ViViD
論文地址:https://arxiv.org/pdf/2405.11794
以上就是關(guān)于【阿里中科大合推虛擬試衣技術(shù)ViViD 輕松實(shí)現(xiàn)視頻換衣】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!