日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

<td id="p7kjh"></td>

<td id="p7kjh"></td>

<small id="np7fp"></small>

<pre id="np7fp"><s id="np7fp"></s></pre>

微調(diào)Flux席卷全網(wǎng)，外國(guó)小哥一人組一隊(duì)漫威英雄！

發(fā)布時(shí)間：2024-08-19 14:30:25 編輯：來(lái)源：

導(dǎo)讀相信很多大家對(duì)微調(diào)Flux席卷全網(wǎng)，外國(guó)小哥一人組一隊(duì)漫威英雄！還不知道吧，今天菲菲就帶你們一起去了解一下~.~！ Midjourney之后，從未見(jiàn)...

相信很多大家對(duì)微調(diào)Flux席卷全網(wǎng)，外國(guó)小哥一人組一隊(duì)漫威英雄！還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

Midjourney之后，從未見(jiàn)人們對(duì)某個(gè)AI生圖應(yīng)用，如此瘋狂著迷。

Flux的橫空出世，意味著AI圖像生成邁入了一個(gè)全新的階段。

馬斯克本人表示，真假已經(jīng)傻傻分不清。

先是，一張TED演講者逼真照片席卷了整個(gè)互聯(lián)網(wǎng)。再之后，集成Flux模型的Grok2破除護(hù)欄限制，被網(wǎng)友玩瘋。

最近，F(xiàn)lux開(kāi)發(fā)者們也紛紛入坑，開(kāi)啟微調(diào)自己的LoRA模型。

HuggingFace聯(lián)創(chuàng)驚嘆道，F(xiàn)lux已經(jīng)完全席卷了開(kāi)源AI界，從未見(jiàn)過(guò)一個(gè)模型，同時(shí)有如此多的衍生模型/在線(xiàn)平臺(tái)/demo占據(jù)熱榜。

一手微調(diào)的開(kāi)發(fā)者表示，「Flux+LoRA將顛覆生成式AI市場(chǎng)。你可以在任何地方，戴著任何東西，穿著任何你喜歡的衣服，生成不同的自己」。

比如，讓自己變身超人。

拿上伸縮光影劍，變身絕地武士，愿原力與你同在。

不僅如此，冰雕，拿著switch游戲機(jī)，精靈耳，時(shí)裝走秀等各種形象的照片，都是動(dòng)動(dòng)嘴皮子的事。

微調(diào)自己的LoRA，現(xiàn)已經(jīng)成為許多開(kāi)發(fā)者的新玩物。

這不，全網(wǎng)都被Flux+LoRA淹沒(méi)了。

一個(gè)人就能組成「復(fù)仇者聯(lián)盟」

Rundown AI的創(chuàng)始人Rowan Cheung將自己的照片作為數(shù)據(jù)，用Flux訓(xùn)練了一個(gè)LoRA模型，然后聯(lián)動(dòng)Runway讓其動(dòng)起來(lái)。

如下，生成了一張類(lèi)似TED演講者的圖片。

做成視頻后，照片中的自己真的活靈活現(xiàn)了，很有演講者范兒。唯一不足的是，右手到后面指頭就變成了2-3根。

另一張，生成了以超人身份拯救世界的自己。

配上動(dòng)畫(huà)，終于做了一回漫威中的英雄。

再生成一張身穿時(shí)裝，走秀現(xiàn)場(chǎng)的照片。

兩邊觀(guān)眾熱烈鼓掌，也算是體驗(yàn)了一把T臺(tái)走秀。

此外，Rowan Cheung還生成了不同風(fēng)格的自己，和場(chǎng)景融合自洽，毫無(wú)違和感。

左右滑動(dòng)查看

他認(rèn)為，雖然AI生圖依舊不能替代完整的電影/商業(yè)廣告，但其已經(jīng)有很多重要的用途，尤其對(duì)內(nèi)容創(chuàng)作者來(lái)說(shuō)。

比如，這些AI圖片制作用于新聞的預(yù)覽圖和配圖，以及短片中的補(bǔ)充素材（B-roll）。

網(wǎng)友Min Choi看后表示，自己可以組建一支「復(fù)仇者聯(lián)盟」了。

前英特爾CTO在A100上，同樣微調(diào)了一個(gè)自己的LoRA模型，75分鐘花費(fèi)了7美金（約50元）。

左右滑動(dòng)查看

還有開(kāi)發(fā)者硬是把自己拍成了恐怖片。

分不清AI還是現(xiàn)實(shí)

要說(shuō)最火的，還是「超現(xiàn)實(shí)主義」的微調(diào)版本——讓人越來(lái)越分不清想象和現(xiàn)實(shí)的邊界了。

是真實(shí)的照片，還是AI畫(huà)出來(lái)的人?

在Flux-Dev中用LoRA訓(xùn)練后，無(wú)論是場(chǎng)景復(fù)雜性還是真實(shí)感，都取得了不可思議的進(jìn)展。

什么風(fēng)格都能微調(diào)

除此之外，各種不同風(fēng)格的微調(diào)也層出不窮。

像素風(fēng)格

開(kāi)發(fā)者以傳奇的ZX Spectrum中的風(fēng)格為例，微調(diào)出類(lèi)似像素的圖片生成LoRA。

下面生成圖像中，有龍珠孫悟空、漫威鋼鐵俠、川建國(guó)（貌似）等形象。

左右滑動(dòng)查看

動(dòng)畫(huà)涂鴉

PS生成式AI產(chǎn)品設(shè)計(jì)人Davis Brown基于Flux，微調(diào)出了一個(gè)half_illustration模型。

它生成的圖片，有一部分是真實(shí)照片的畫(huà)風(fēng)，一部分是動(dòng)畫(huà)涂鴉的風(fēng)格。

每次生圖前，只需要在提示開(kāi)頭加上——In the style of TOK。

然后，具體描述想要的效果，就能立即出片。

以后感覺(jué)不一定非得用PS，直接AI生圖就可以了。

還有其他涂鴉風(fēng)格的照片。

左右滑動(dòng)查看

九宮格

開(kāi)源數(shù)據(jù)集平臺(tái)LAION用Flux模型，訓(xùn)出了一個(gè)可以生成3x3九宮格照片，還是不同角度的自己。

以后自拍一張，就夠了。

左右滑動(dòng)查看

不同年齡

一個(gè)人一生的樣貌，透過(guò)Flux+LoRA便可看到。

左右滑動(dòng)查看

另一個(gè)例子:

左右滑動(dòng)查看

可玩性超強(qiáng)

今天的主角——FLUX.1，采用了一種全新的「流匹配」技術(shù)。

以前的擴(kuò)散模型是通過(guò)逐步去除從隨機(jī)起點(diǎn)開(kāi)始的噪聲來(lái)創(chuàng)建圖像，而流匹配則采用更直接的方法，學(xué)習(xí)將噪聲轉(zhuǎn)換為真實(shí)圖像所需的精確變化。

這種方法上的差異帶來(lái)了獨(dú)特的美學(xué)風(fēng)格，并在速度和控制方面具備極大的優(yōu)勢(shì)。

文本:大部分都能get到

文本到圖像生成的挑戰(zhàn)之一是準(zhǔn)確地將文字轉(zhuǎn)化為視覺(jué)表現(xiàn)。FLUX.1在這方面處理得相當(dāng)好，即使是在像表情包這樣復(fù)雜的場(chǎng)景中。

prompt:

prompt:

光線(xiàn)和質(zhì)感都不錯(cuò)

FLUX.1對(duì)光線(xiàn)、陰影和紋理有敏銳的理解，能始終如一地生成高質(zhì)量的圖像。

prompt:

在這幅圖里，重點(diǎn)不僅在于玻璃的質(zhì)感，還在于光線(xiàn)如何通過(guò)花瓣折射和傳遞，創(chuàng)造出一種發(fā)光的效果。

prompt:

藝術(shù)風(fēng)格:不止是模仿

FLUX.1似乎掌握了各種藝術(shù)風(fēng)格背后的原理，使得創(chuàng)造性的重新詮釋成為可能。

prompt:

這幅《神奈川沖浪里》的「水彩」版本不僅暗示著標(biāo)志性波浪是模型訓(xùn)練數(shù)據(jù)的一部分，還突出了「流」技術(shù)如何近似顏料在水、紙和墨水中的運(yùn)動(dòng)。

構(gòu)圖:讓場(chǎng)景有意義

FLUX.1擅長(zhǎng)構(gòu)建復(fù)雜的場(chǎng)景，以一種既真實(shí)又有視覺(jué)吸引力的方式放置物體和角色。

prompt:

「流」:一種新的視覺(jué)語(yǔ)言

FLUX.1所采用的流匹配技術(shù)，賦予了圖像一種獨(dú)特的有機(jī)運(yùn)動(dòng)感和流動(dòng)性，仿佛像素本身在流動(dòng)。

prompt:

總有一款工具，能幫你搞定

我們可以把圖像的生成過(guò)程概括為:獲取一些輸入像素，將它們從噪聲中稍微移開(kāi)，朝著由你的文本輸入創(chuàng)建的模式移動(dòng)，并重復(fù)這一過(guò)程，直到達(dá)到設(shè)定的步驟數(shù)。

而微調(diào)過(guò)程則是從數(shù)據(jù)集中獲取每個(gè)圖像/標(biāo)注對(duì)，并稍微更新其內(nèi)部映射。

只要可以通過(guò)圖像-標(biāo)題對(duì)表示，你就可以通過(guò)這種方式教會(huì)模型任何內(nèi)容:角色、場(chǎng)景、媒介、風(fēng)格、流派。

左:使用原始FLUX.1模型生成;右:使用相同提示和種子，在fofr/flux-bad-70s-food模型上生成

在訓(xùn)練中，模型將會(huì)學(xué)習(xí)如何把這些概念與特定的文本字符串關(guān)聯(lián)起來(lái)。而在提示中，則需要加入這個(gè)字符串來(lái)激活這種關(guān)聯(lián)。

比如，你想微調(diào)一個(gè)「漫畫(huà)風(fēng)超級(jí)英雄」的模型。

首先，需要收集大量關(guān)于角色的圖像作為數(shù)據(jù)集，包括但不限于:不同的場(chǎng)景、服裝、燈光，甚至可能是不同的藝術(shù)風(fēng)格

然后，選擇一個(gè)簡(jiǎn)短且不常見(jiàn)的詞或短語(yǔ)作為你的觸發(fā)詞:一種不會(huì)與其他概念或微調(diào)沖突的獨(dú)特內(nèi)容。你可能會(huì)選擇像「糟糕的70年代食物」或「JELLOMOLD」這樣的詞。

在訓(xùn)練完成之后，你只需給出一個(gè)包含觸發(fā)詞的提示，如「在舊金山的聚會(huì)上拍攝糟糕的70年代食物的場(chǎng)景」，模型就會(huì)調(diào)用你之前微調(diào)時(shí)加入的特定概念。

就這么簡(jiǎn)單。

在了解了原理之后，我們就可以任選一個(gè)工具來(lái)微調(diào)模型了。

左:使用原始FLUX.1模型生成;右:使用相同提示和種子，在fofr/flux-bad-70s-food模型上生成

比如一位叫Matt Wolfe的小哥，在看到上面這些酷炫的生成之后，也好奇地上手試了一把。

結(jié)果，他翻車(chē)了……

做出的AI圖像，堪稱(chēng)買(mǎi)家秀和賣(mài)家秀的區(qū)別。

這是他生成的——

這是別人的——

兩張圖片高下立判，區(qū)別就在于用沒(méi)用LoRA微調(diào)。

被刺激到的小哥，立刻去研究了一番，他驚喜地發(fā)現(xiàn)，LoRA模型很小，只有2到500MB，可以輕易地和現(xiàn)有的模型結(jié)合。

更令人驚喜的是，并不需要額外的算力，也不需要全面的再訓(xùn)練，就可以讓AI模型提高畫(huà)質(zhì)，產(chǎn)生獨(dú)特的風(fēng)格，或者生成特殊的人物，比如馬里奧或者海綿寶寶。

遺憾的是，在小哥用得順手的Glif上，F(xiàn)lux中并不能使用LoRA。

他發(fā)現(xiàn)，能使用Flux的其中一種方法，是用ComfyUI。

這張圖，相信很多人都很熟悉了

或者，也可以使用Replicate、HuggingFace Spaces或Fal AI之類(lèi)的平臺(tái)。

小哥在Fal平臺(tái)上試用后，發(fā)現(xiàn)每百萬(wàn)像素花費(fèi)0.035美元，所以，只要花1美元，就可以運(yùn)行模型29次，還是比較劃算的。

在這里FLUX.1dev、Flux Realism LoRA、FLUX.1pro等等，都是可以使用的。

小哥二話(huà)不說(shuō)，選擇了Flux Realism LoRA。

經(jīng)過(guò)精心調(diào)試后，小哥將推理步長(zhǎng)設(shè)置在了28，CFG設(shè)置在了2。

產(chǎn)生的圖像，效果非常驚喜!

如果說(shuō)有什么瑕疵，就是額頭皺紋處的打光仍然不自然。

接下來(lái)，小哥興奮地將圖像導(dǎo)到Gen-3Alpha中，根據(jù)他輸入的prompt，Gen-3Alpha生成了視頻。

除了在某一刻，手中的麥克風(fēng)突然「飄浮」了起來(lái)，視頻的其余部分，挑不出太大毛病了。

小哥又嘗試了一遍，生成了第二個(gè)視頻。

這一次，麥克風(fēng)又顯得太過(guò)靜止了，仿佛定在了原地。

另外，小哥也加入了全網(wǎng)爆改自己的大潮，生成一系列爆笑的照片。

最后，小哥再用Gen-3Alpha把它變成視頻，就讓自己和死侍走在了同一部電影的畫(huà)面中。

參考資料:

https://x.com/dr_cintas/status/1824480995317350401

https://x.com/Gorden_Sun/status/1824843049421484309

https://replicate.com/blog/fine-tune-flux

https://x.com/laion_ai/status/1824814210758459548

https://www.youtube.com/watch?v=_rjto4ix3rA

https://www.youtube.com/watch?v=rDu481JFwqM

以上就是關(guān)于【微調(diào)Flux席卷全網(wǎng)，外國(guó)小哥一人組一隊(duì)漫威英雄！】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

免責(zé)聲明：本文由用戶(hù)上傳，如有侵權(quán)請(qǐng)聯(lián)系刪除！

相關(guān)閱讀

最新文章