剛剛,Stable Diffusion 3.5重磅開源,文生圖模型霸主歸來(lái)!
相信很多大家對(duì)剛剛,Stable Diffusion 3.5重磅開源,文生圖模型霸主歸來(lái)!還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
著名大模型開源平臺(tái)Stability AI,開源了超強(qiáng)文生圖模型——Stable Diffusion3.5。
Stable Diffusion3.5一共有Large、Large Turbo和Medium三個(gè)版本,可根據(jù)不同的商業(yè)環(huán)境提供高度定制功能,同時(shí)對(duì)這些模型進(jìn)行了大幅度優(yōu)化可在消費(fèi)級(jí)GPU就能輕松推理運(yùn)行。
開源地址:https://huggingface.co/stabilityai
Github:https://github.com/Stability-AI/sd3.5
今年6月Stability AI首次開源了Stable Diffusion3Medium,但效果未達(dá)到預(yù)期,在聽取了社區(qū)用戶的反饋后,Stability AI花費(fèi)大量時(shí)間進(jìn)一步開發(fā),便有了最新的3.5版本。
Large、Turbo、Medium簡(jiǎn)單介紹
在這次發(fā)布中,Stable Diffusion3.5提供了多種模型,以滿足不同用戶群體的需求。Stable Diffusion3.5Large模型擁有80億參數(shù),提供了卓越的圖片質(zhì)量和高度文本語(yǔ)義還原,是Stable Diffusion家族中最強(qiáng)大的模型,非常適合專業(yè)使用,尤其是在100萬(wàn)像素分辨率的圖片。
而Stable Diffusion3.5Large Turbo模型則是一個(gè)蒸餾版本,它能夠在僅僅4步之內(nèi)生成高質(zhì)量的圖像,并且對(duì)提示的遵循性非常好,速度比Stable Diffusion3.5Large快得多。
Stable Diffusion3.5Medium模型將在10月29日發(fā)布,這個(gè)模型有25億參數(shù),采用了改進(jìn)的MMDiT-X架構(gòu)和訓(xùn)練方法,能在消費(fèi)級(jí)硬件上即開即用,可生成0.25—200萬(wàn)像素之間生成圖像,兼顧了質(zhì)量和易定制性。
在開發(fā)這些模型的過(guò)程中,Stability AI優(yōu)先考慮了可定制性,提供了一個(gè)靈活的基礎(chǔ)來(lái)構(gòu)建。
將Query-Key歸一化集成到了變換器塊中,這不僅穩(wěn)定了模型訓(xùn)練過(guò)程,還簡(jiǎn)化了進(jìn)一步的微調(diào)和開發(fā)。
為了支持這種下游的靈活性,Stability AI不得不做出一些權(quán)衡,例如,同一個(gè)提示使用不同種子可能會(huì)產(chǎn)生更大的輸出變化,這是有意為之的,以幫助在基礎(chǔ)模型中保留更廣泛的知識(shí)庫(kù)和多樣化的風(fēng)格。
此外,Stable Diffusion3.5在可定制性、高效的性能以及多樣化的輸出方面表現(xiàn)出色,使其成為市場(chǎng)上最可定制和最易訪問(wèn)的文生圖像模型之一,同時(shí)在提示遵循性和圖像質(zhì)量方面保持了頂級(jí)性能。
以上就是關(guān)于【剛剛,Stable Diffusion 3.5重磅開源,文生圖模型霸主歸來(lái)!】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!