日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

      <td id="p7kjh"></td>
      <td id="p7kjh"></td>

      微調(diào)Flux席卷全網(wǎng),外國(guó)小哥一人組一隊(duì)漫威英雄!

      發(fā)布時(shí)間:2024-08-19 14:30:25 編輯: 來(lái)源:
      導(dǎo)讀 相信很多大家對(duì)微調(diào)Flux席卷全網(wǎng),外國(guó)小哥一人組一隊(duì)漫威英雄!還不知道吧,今天菲菲就帶你們一起去了解一下~.~! Midjourney之后,從未見(jiàn)...

      相信很多大家對(duì)微調(diào)Flux席卷全網(wǎng),外國(guó)小哥一人組一隊(duì)漫威英雄!還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

      Midjourney之后,從未見(jiàn)人們對(duì)某個(gè)AI生圖應(yīng)用,如此瘋狂著迷。

      Flux的橫空出世,意味著AI圖像生成邁入了一個(gè)全新的階段。

      馬斯克本人表示,真假已經(jīng)傻傻分不清。

      先是,一張TED演講者逼真照片席卷了整個(gè)互聯(lián)網(wǎng)。再之后,集成Flux模型的Grok2破除護(hù)欄限制,被網(wǎng)友玩瘋。

      最近,F(xiàn)lux開(kāi)發(fā)者們也紛紛入坑,開(kāi)啟微調(diào)自己的LoRA模型。

      HuggingFace聯(lián)創(chuàng)驚嘆道,F(xiàn)lux已經(jīng)完全席卷了開(kāi)源AI界,從未見(jiàn)過(guò)一個(gè)模型,同時(shí)有如此多的衍生模型/在線(xiàn)平臺(tái)/demo占據(jù)熱榜。

      一手微調(diào)的開(kāi)發(fā)者表示,「Flux+LoRA將顛覆生成式AI市場(chǎng)。你可以在任何地方,戴著任何東西,穿著任何你喜歡的衣服,生成不同的自己」。

      比如,讓自己變身超人。

      拿上伸縮光影劍,變身絕地武士,愿原力與你同在。

      不僅如此,冰雕,拿著switch游戲機(jī),精靈耳,時(shí)裝走秀等各種形象的照片,都是動(dòng)動(dòng)嘴皮子的事。

      微調(diào)自己的LoRA,現(xiàn)已經(jīng)成為許多開(kāi)發(fā)者的新玩物。

      這不,全網(wǎng)都被Flux+LoRA淹沒(méi)了。

      一個(gè)人就能組成「復(fù)仇者聯(lián)盟」

      Rundown AI的創(chuàng)始人Rowan Cheung將自己的照片作為數(shù)據(jù),用Flux訓(xùn)練了一個(gè)LoRA模型,然后聯(lián)動(dòng)Runway讓其動(dòng)起來(lái)。

      如下,生成了一張類(lèi)似TED演講者的圖片。

      做成視頻后,照片中的自己真的活靈活現(xiàn)了,很有演講者范兒。唯一不足的是,右手到后面指頭就變成了2-3根。

      另一張,生成了以超人身份拯救世界的自己。

      配上動(dòng)畫(huà),終于做了一回漫威中的英雄。

      再生成一張身穿時(shí)裝,走秀現(xiàn)場(chǎng)的照片。

      兩邊觀(guān)眾熱烈鼓掌,也算是體驗(yàn)了一把T臺(tái)走秀。

      此外,Rowan Cheung還生成了不同風(fēng)格的自己,和場(chǎng)景融合自洽,毫無(wú)違和感。

      左右滑動(dòng)查看

      他認(rèn)為,雖然AI生圖依舊不能替代完整的電影/商業(yè)廣告,但其已經(jīng)有很多重要的用途,尤其對(duì)內(nèi)容創(chuàng)作者來(lái)說(shuō)。

      比如,這些AI圖片制作用于新聞的預(yù)覽圖和配圖,以及短片中的補(bǔ)充素材(B-roll)。

      網(wǎng)友Min Choi看后表示,自己可以組建一支「復(fù)仇者聯(lián)盟」了。

      前英特爾CTO在A100上,同樣微調(diào)了一個(gè)自己的LoRA模型,75分鐘花費(fèi)了7美金(約50元)。

      左右滑動(dòng)查看

      還有開(kāi)發(fā)者硬是把自己拍成了恐怖片。

      分不清AI還是現(xiàn)實(shí)

      要說(shuō)最火的,還是「超現(xiàn)實(shí)主義」的微調(diào)版本——讓人越來(lái)越分不清想象和現(xiàn)實(shí)的邊界了。

      是真實(shí)的照片,還是AI畫(huà)出來(lái)的人?

      在Flux-Dev中用LoRA訓(xùn)練后,無(wú)論是場(chǎng)景復(fù)雜性還是真實(shí)感,都取得了不可思議的進(jìn)展。

      什么風(fēng)格都能微調(diào)

      除此之外,各種不同風(fēng)格的微調(diào)也層出不窮。

      像素風(fēng)格

      開(kāi)發(fā)者以傳奇的ZX Spectrum中的風(fēng)格為例,微調(diào)出類(lèi)似像素的圖片生成LoRA。

      下面生成圖像中,有龍珠孫悟空、漫威鋼鐵俠、川建國(guó)(貌似)等形象。

      左右滑動(dòng)查看

      動(dòng)畫(huà)涂鴉

      PS生成式AI產(chǎn)品設(shè)計(jì)人Davis Brown基于Flux,微調(diào)出了一個(gè)half_illustration模型。

      它生成的圖片,有一部分是真實(shí)照片的畫(huà)風(fēng),一部分是動(dòng)畫(huà)涂鴉的風(fēng)格。

      每次生圖前,只需要在提示開(kāi)頭加上——In the style of TOK。

      然后,具體描述想要的效果,就能立即出片。

      以后感覺(jué)不一定非得用PS,直接AI生圖就可以了。

      還有其他涂鴉風(fēng)格的照片。

      左右滑動(dòng)查看

      九宮格

      開(kāi)源數(shù)據(jù)集平臺(tái)LAION用Flux模型,訓(xùn)出了一個(gè)可以生成3x3九宮格照片,還是不同角度的自己。

      以后自拍一張,就夠了。

      左右滑動(dòng)查看

      不同年齡

      一個(gè)人一生的樣貌,透過(guò)Flux+LoRA便可看到。

      左右滑動(dòng)查看

      另一個(gè)例子:

      左右滑動(dòng)查看

      可玩性超強(qiáng)

      今天的主角——FLUX.1,采用了一種全新的「流匹配」技術(shù)。

      以前的擴(kuò)散模型是通過(guò)逐步去除從隨機(jī)起點(diǎn)開(kāi)始的噪聲來(lái)創(chuàng)建圖像,而流匹配則采用更直接的方法,學(xué)習(xí)將噪聲轉(zhuǎn)換為真實(shí)圖像所需的精確變化。

      這種方法上的差異帶來(lái)了獨(dú)特的美學(xué)風(fēng)格,并在速度和控制方面具備極大的優(yōu)勢(shì)。

      文本:大部分都能get到

      文本到圖像生成的挑戰(zhàn)之一是準(zhǔn)確地將文字轉(zhuǎn)化為視覺(jué)表現(xiàn)。FLUX.1在這方面處理得相當(dāng)好,即使是在像表情包這樣復(fù)雜的場(chǎng)景中。

      prompt:

      prompt:

      光線(xiàn)和質(zhì)感都不錯(cuò)

      FLUX.1對(duì)光線(xiàn)、陰影和紋理有敏銳的理解,能始終如一地生成高質(zhì)量的圖像。

      prompt:

      在這幅圖里,重點(diǎn)不僅在于玻璃的質(zhì)感,還在于光線(xiàn)如何通過(guò)花瓣折射和傳遞,創(chuàng)造出一種發(fā)光的效果。

      prompt:

      藝術(shù)風(fēng)格:不止是模仿

      FLUX.1似乎掌握了各種藝術(shù)風(fēng)格背后的原理,使得創(chuàng)造性的重新詮釋成為可能。

      prompt:

      這幅《神奈川沖浪里》的「水彩」版本不僅暗示著標(biāo)志性波浪是模型訓(xùn)練數(shù)據(jù)的一部分,還突出了「流」技術(shù)如何近似顏料在水、紙和墨水中的運(yùn)動(dòng)。

      構(gòu)圖:讓場(chǎng)景有意義

      FLUX.1擅長(zhǎng)構(gòu)建復(fù)雜的場(chǎng)景,以一種既真實(shí)又有視覺(jué)吸引力的方式放置物體和角色。

      prompt:

      「流」:一種新的視覺(jué)語(yǔ)言

      FLUX.1所采用的流匹配技術(shù),賦予了圖像一種獨(dú)特的有機(jī)運(yùn)動(dòng)感和流動(dòng)性,仿佛像素本身在流動(dòng)。

      prompt:

      總有一款工具,能幫你搞定

      我們可以把圖像的生成過(guò)程概括為:獲取一些輸入像素,將它們從噪聲中稍微移開(kāi),朝著由你的文本輸入創(chuàng)建的模式移動(dòng),并重復(fù)這一過(guò)程,直到達(dá)到設(shè)定的步驟數(shù)。

      而微調(diào)過(guò)程則是從數(shù)據(jù)集中獲取每個(gè)圖像/標(biāo)注對(duì),并稍微更新其內(nèi)部映射。

      只要可以通過(guò)圖像-標(biāo)題對(duì)表示,你就可以通過(guò)這種方式教會(huì)模型任何內(nèi)容:角色、場(chǎng)景、媒介、風(fēng)格、流派。

      左:使用原始FLUX.1模型生成;右:使用相同提示和種子,在fofr/flux-bad-70s-food模型上生成

      在訓(xùn)練中,模型將會(huì)學(xué)習(xí)如何把這些概念與特定的文本字符串關(guān)聯(lián)起來(lái)。而在提示中,則需要加入這個(gè)字符串來(lái)激活這種關(guān)聯(lián)。

      比如,你想微調(diào)一個(gè)「漫畫(huà)風(fēng)超級(jí)英雄」的模型。

      首先,需要收集大量關(guān)于角色的圖像作為數(shù)據(jù)集,包括但不限于:不同的場(chǎng)景、服裝、燈光,甚至可能是不同的藝術(shù)風(fēng)格

      然后,選擇一個(gè)簡(jiǎn)短且不常見(jiàn)的詞或短語(yǔ)作為你的觸發(fā)詞:一種不會(huì)與其他概念或微調(diào)沖突的獨(dú)特內(nèi)容。你可能會(huì)選擇像「糟糕的70年代食物」或「JELLOMOLD」這樣的詞。

      在訓(xùn)練完成之后,你只需給出一個(gè)包含觸發(fā)詞的提示,如「在舊金山的聚會(huì)上拍攝糟糕的70年代食物的場(chǎng)景」,模型就會(huì)調(diào)用你之前微調(diào)時(shí)加入的特定概念。

      就這么簡(jiǎn)單。

      在了解了原理之后,我們就可以任選一個(gè)工具來(lái)微調(diào)模型了。

      左:使用原始FLUX.1模型生成;右:使用相同提示和種子,在fofr/flux-bad-70s-food模型上生成

      比如一位叫Matt Wolfe的小哥,在看到上面這些酷炫的生成之后,也好奇地上手試了一把。

      結(jié)果,他翻車(chē)了……

      做出的AI圖像,堪稱(chēng)買(mǎi)家秀和賣(mài)家秀的區(qū)別。

      這是他生成的——

      這是別人的——

      兩張圖片高下立判,區(qū)別就在于用沒(méi)用LoRA微調(diào)。

      被刺激到的小哥,立刻去研究了一番,他驚喜地發(fā)現(xiàn),LoRA模型很小,只有2到500MB,可以輕易地和現(xiàn)有的模型結(jié)合。

      更令人驚喜的是,并不需要額外的算力,也不需要全面的再訓(xùn)練,就可以讓AI模型提高畫(huà)質(zhì),產(chǎn)生獨(dú)特的風(fēng)格,或者生成特殊的人物,比如馬里奧或者海綿寶寶。

      遺憾的是,在小哥用得順手的Glif上,F(xiàn)lux中并不能使用LoRA。

      他發(fā)現(xiàn),能使用Flux的其中一種方法,是用ComfyUI。

      這張圖,相信很多人都很熟悉了

      或者,也可以使用Replicate、HuggingFace Spaces或Fal AI之類(lèi)的平臺(tái)。

      小哥在Fal平臺(tái)上試用后,發(fā)現(xiàn)每百萬(wàn)像素花費(fèi)0.035美元,所以,只要花1美元,就可以運(yùn)行模型29次,還是比較劃算的。

      在這里FLUX.1dev、Flux Realism LoRA、FLUX.1pro等等,都是可以使用的。

      小哥二話(huà)不說(shuō),選擇了Flux Realism LoRA。

      經(jīng)過(guò)精心調(diào)試后,小哥將推理步長(zhǎng)設(shè)置在了28,CFG設(shè)置在了2。

      產(chǎn)生的圖像,效果非常驚喜!

      如果說(shuō)有什么瑕疵,就是額頭皺紋處的打光仍然不自然。

      接下來(lái),小哥興奮地將圖像導(dǎo)到Gen-3Alpha中,根據(jù)他輸入的prompt,Gen-3Alpha生成了視頻。

      除了在某一刻,手中的麥克風(fēng)突然「飄浮」了起來(lái),視頻的其余部分,挑不出太大毛病了。

      小哥又嘗試了一遍,生成了第二個(gè)視頻。

      這一次,麥克風(fēng)又顯得太過(guò)靜止了,仿佛定在了原地。

      另外,小哥也加入了全網(wǎng)爆改自己的大潮,生成一系列爆笑的照片。

      最后,小哥再用Gen-3Alpha把它變成視頻,就讓自己和死侍走在了同一部電影的畫(huà)面中。

      參考資料:

      https://x.com/dr_cintas/status/1824480995317350401

      https://x.com/Gorden_Sun/status/1824843049421484309

      https://replicate.com/blog/fine-tune-flux

      https://x.com/laion_ai/status/1824814210758459548

      https://www.youtube.com/watch?v=_rjto4ix3rA

      https://www.youtube.com/watch?v=rDu481JFwqM

      以上就是關(guān)于【微調(diào)Flux席卷全網(wǎng),外國(guó)小哥一人組一隊(duì)漫威英雄!】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!

      免責(zé)聲明:本文由用戶(hù)上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

      熱點(diǎn)推薦

      精選文章