日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

<td id="p7kjh"></td>

<td id="p7kjh"></td>

<pre id="jq7ue"><u id="jq7ue"></u></pre>

<abbr id="jq7ue"></abbr>

比對(duì)口型還牛！InstructAvatar：實(shí)現(xiàn)文字生成指定面部的表情和動(dòng)作

發(fā)布時(shí)間：2024-05-28 11:00:35 編輯：來(lái)源：

導(dǎo)讀相信很多大家對(duì)比對(duì)口型還牛！InstructAvatar：實(shí)現(xiàn)文字生成指定面部的表情和動(dòng)作還不知道吧，今天菲菲就帶你們一起去了解一下~.~！ 5月2...

相信很多大家對(duì)比對(duì)口型還牛！InstructAvatar：實(shí)現(xiàn)文字生成指定面部的表情和動(dòng)作還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

5月28日消息:最近，對(duì)話形象生成模型在實(shí)現(xiàn)與音頻的逼真準(zhǔn)確口型同步方面取得了進(jìn)展，但在控制和傳達(dá)形象的細(xì)節(jié)表情和情感方面仍有不足，使生成的視頻缺乏生動(dòng)性和可控性。

因此，北京大學(xué)的研究團(tuán)隊(duì)提出了一種名為 InstructAvatar 的新穎方法，通過(guò)自然語(yǔ)言界面來(lái)控制虛擬形象的情感和面部動(dòng)作，從而提供了對(duì)生成的視頻進(jìn)行細(xì)粒度控制的能力。InstructAvatar可實(shí)現(xiàn)的效果包括：

通過(guò)自然語(yǔ)言輸入控制頭像的情緒和面部動(dòng)作。

利用一個(gè)自動(dòng)注釋管道構(gòu)建訓(xùn)練數(shù)據(jù)集，使得頭像可以根據(jù)文本指令和音頻進(jìn)行生成。

生成的頭像能夠準(zhǔn)確同步口型，表情自然且生動(dòng)。

相比于現(xiàn)有方法，在細(xì)粒度情緒控制、口型同步質(zhì)量和自然度方面有更好的表現(xiàn)。

InstructAvatar 的框架包括兩個(gè)組件:變分自動(dòng)編碼器（VAE）和基于擴(kuò)散模型的動(dòng)作生成器。VAE 用于將動(dòng)作信息從視頻中解耦，并根據(jù)音頻和指令生成器生成的動(dòng)作潛變量來(lái)生成最終的視頻。在推理過(guò)程中，通過(guò)迭代去噪高斯噪聲來(lái)獲取預(yù)測(cè)的動(dòng)作潛變量，并結(jié)合用戶提供的肖像，使用 VAE 的解碼器生成最終的視頻。

通過(guò)與基線模型的定性比較，可以看出 InstructAvatar 在唇同步質(zhì)量和情感可控性方面取得了良好的效果。此外，模型生成的結(jié)果具有增強(qiáng)的自然性，并有效地保留了身份特征。

值得一提的是，該模型僅基于文本輸入推斷說(shuō)話的情感，這在直觀上提出了一個(gè)更具挑戰(zhàn)性的任務(wù)。模型支持更廣泛的指令范圍，超出了大多數(shù)基線模型的范圍。

此外，該模型展現(xiàn)了精確的情感控制能力，并生成了自然的結(jié)果。InstructAvatar 具有細(xì)粒度的控制能力，并在領(lǐng)域之外的場(chǎng)景中表現(xiàn)出良好的泛化能力。

項(xiàng)目入口：https://top.aibase.com/tool/instructavatar

以上就是關(guān)于【比對(duì)口型還牛！InstructAvatar：實(shí)現(xiàn)文字生成指定面部的表情和動(dòng)作】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

比對(duì)口型還牛！InstructAvatar：實(shí)現(xiàn)文字生成指定面部的表情和動(dòng)作

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請(qǐng)聯(lián)系刪除！

上一篇

下一篇

相關(guān)閱讀

vivo X100 Ultra今日開(kāi)售：6499元起

趙明回應(yīng)榮耀和雅顧合作：?jiǎn)渭兊穆?lián)名沒(méi)有價(jià)值

馬斯克的 xAI 融資 60 億美元，估值達(dá) 240 億美元

?Windows新功能將允許用戶從Android照片中提取文本

降噪黑科技Look Once to Hear！只需看一眼說(shuō)話的人除了他以外的聲音就消失了

蘋(píng)果的“Greymatter 項(xiàng)目”將是普通用戶在日常中可使用的AI工具

蘋(píng)果的“Project Greymatter” 旨在利用AI為日常生活帶來(lái)便利

“數(shù)字中國(guó)”前瞻：誰(shuí)是AI大模型時(shí)代的馴龍高手？

深談618:超頭乏力，新老平臺(tái)“廝殺”

文字生成手語(yǔ)視頻大模型SignLLM 幫助聽(tīng)障人群實(shí)現(xiàn)無(wú)障礙溝通

最新文章

比對(duì)口型還牛！InstructAvatar：實(shí)現(xiàn)文字生成指定面部的表情和動(dòng)作

洋參片有什么作用（洋參片泡水功效）

《慶余年2》熱播：范思轍摘不掉的大金項(xiàng)圈引發(fā)熱議

繪畫(huà)大賽獲獎(jiǎng)作品（繪畫(huà)大賽）

寶馬工廠“機(jī)器狗”SpOTTO 上崗可“嗅探”過(guò)熱故障和壓縮空氣泄漏

掏襠竟然也是競(jìng)技運(yùn)動(dòng)（自編長(zhǎng)篇掏襠故事）

生命生命閱讀（生命生命閱讀答案）

華為暢享 70S 手機(jī)今日開(kāi)啟預(yù)售：售價(jià) 1199 元起

研究發(fā)現(xiàn)：生成式人工智能正在迅速進(jìn)入媒體和娛樂(lè)行業(yè)

共享網(wǎng)絡(luò)打印機(jī)設(shè)置方法（共享網(wǎng)絡(luò)打印機(jī)設(shè)置）

熱點(diǎn)推薦

繪畫(huà)大賽獲獎(jiǎng)作品（繪畫(huà)大賽）

關(guān)于勤奮的名人的事例簡(jiǎn)短（勤奮的名人事例）

穿越柯南之boss是我哥（柯南里boss是誰(shuí)）

絕色神偷蜘蛛戴手套（絕色神偷蜘蛛）

魚(yú)翅的圖片與價(jià)格（魚(yú)翅）

李易安與酒文化的關(guān)系（李易安）

英語(yǔ)人稱代詞主格賓格所有格（英語(yǔ)人稱代詞主格賓格表）

降噪黑科技Look Once to Hear！只需看一眼說(shuō)話的人除了他以外的聲音就消失了

力帆k19太子摩托車參數(shù)價(jià)格（太子摩托車報(bào)價(jià)及圖片）

肛瘺是什么原因引起的（肛瘺）

中國(guó)恩菲工程技術(shù)有限公司怎么樣（中國(guó)恩菲工程技術(shù)有限公司）

王冕僧寺夜讀題目及答案（王冕僧寺夜讀閱讀答案）

杉木指接板價(jià)格（杉木指接板）

俗語(yǔ)打太極什么意思（說(shuō)人打太極是什么意思）

陜西省醫(yī)學(xué)考試中心官網(wǎng)（陜西省人事考試中心）

精選文章

洋參片有什么作用（洋參片泡水功效）

生命生命閱讀（生命生命閱讀答案）

研究發(fā)現(xiàn)：生成式人工智能正在迅速進(jìn)入媒體和娛樂(lè)行業(yè)

北京工業(yè)大學(xué)就業(yè)創(chuàng)業(yè)指導(dǎo)中心（北京工業(yè)大學(xué)就業(yè)信息網(wǎng)）

靜逸與靜謐的讀音（謐的讀音）

趙明談榮耀MagicOS信息安全：排在所有應(yīng)用前面用戶自主選擇授權(quán)

榮耀趙明回應(yīng)車業(yè)務(wù)最新進(jìn)展：競(jìng)爭(zhēng)很激烈不缺一個(gè)榮耀

鐘薛高創(chuàng)始人將直播賣紅薯已開(kāi)通淘寶直播賬號(hào)

網(wǎng)址發(fā)布頁(yè)入口大全（網(wǎng)址發(fā)布）

萬(wàn)里無(wú)云的拼音（萬(wàn)里無(wú)云）

vivo X100 Ultra今日開(kāi)售：6499元起

趙明回應(yīng)榮耀和雅顧合作：?jiǎn)渭兊穆?lián)名沒(méi)有價(jià)值

一?？荚囀鞘裁矗ㄒ荒？荚嚕?/a>

不開(kāi)心的時(shí)候怎么辦呀（不開(kāi)心的時(shí)候怎么辦）

馬斯克的 xAI 融資 60 億美元，估值達(dá) 240 億美元

? 2008-2024 All Rights Reserved .新訊網(wǎng) 版權(quán)所有

網(wǎng)站地圖 | 百度地圖 | 今日更新

日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

97超级碰在线观看免费亚洲免费视频在线观看69 中文字幕日本无吗在线观看一区二区三区