Meta的Llama-3.1-405B遭泄漏,可下載,性能超GPT-4o!
相信很多大家對(duì)Meta的Llama-3.1-405B遭泄漏,可下載,性能超GPT-4o!還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
7月23日凌晨,有人爆料,Meta的Llama3.1-405B評(píng)測(cè)數(shù)據(jù)遭遇泄漏,明天可能會(huì)發(fā)布Llama3系列中最大的參數(shù)模型,同時(shí)還會(huì)發(fā)布一個(gè)Llama3.1-70B版本。
這也是在3.0版本基礎(chǔ)之上進(jìn)行了功能迭代,即便是70B的基礎(chǔ)模型的性能也超過(guò)了GPT-4o。
就連磁力鏈接都流出來(lái)了,「AIGC開(kāi)放社區(qū)」試了一下大約有763.84G。本來(lái)huggingface上也有的,后來(lái)庫(kù)被刪除了。
磁力地址:
Magnet: magnet:?xt=urn:btih:c0e342ae5677582f92c52d8019cc32e1f86f1d83&dn=miqu-2&tr=udp%3A%2F%https://2Ftracker.openbittorrent.com%3A80
下載速度也還可以,每秒14M左右,看來(lái)確實(shí)是有不少人在下這個(gè)模型。
但這個(gè)模型一般的GPU肯定是跑不起來(lái),如此大的參數(shù)在部署方面?zhèn)€人開(kāi)發(fā)者也負(fù)擔(dān)不起(如果你有一些H100也沒(méi)問(wèn)題),估計(jì)是給企業(yè)、政務(wù)公共部門(mén)用的。
對(duì)于Meta即將發(fā)布的模型,就有網(wǎng)友潑冷水。相比OpenAI最新的GPT-4o mini版本,Llama3.1-70B推理成本提升了3倍,但編碼的性能卻要差很多。
從性?xún)r(jià)比、功能來(lái)看,Meta的新模型也沒(méi)什么值得期待的。
還有人甚至在GitHub上看到了上述發(fā)布的模型,但很快就拿下來(lái)了,估計(jì)有一些人可能已經(jīng)能使用了。
也有人表示,對(duì)于這個(gè)泄漏事件他認(rèn)為是真的,因?yàn)檫@是從微軟的Azure Github流出來(lái)的。
但是這個(gè)模型參數(shù)較大,對(duì)GPU的要求太高了,不如GPT-4o mini性?xún)r(jià)比高。
雖然模型是免費(fèi)的,想運(yùn)行起來(lái)還是相當(dāng)費(fèi)勁的,沒(méi)有企業(yè)級(jí)的算力基礎(chǔ)真的無(wú)法使用。所以,這對(duì)于企業(yè)來(lái)說(shuō)是一個(gè)不錯(cuò)的好消息。
有人指出即便對(duì)Llama3.1-405B模型進(jìn)行大幅度優(yōu)化,量化到5位數(shù),仍然無(wú)法適用于消費(fèi)級(jí)GPU,真的是對(duì)硬件要求特別高。
如果這份評(píng)測(cè)數(shù)據(jù)是真的,那么對(duì)于全球多數(shù)國(guó)家來(lái)說(shuō)都是一個(gè)天大的福利。因?yàn)檫@是Meta的Llama3系列的頂級(jí)模型并且是全部開(kāi)放權(quán)重,也就是說(shuō)人人都能用上免費(fèi)的AI模型。
但是如果想開(kāi)發(fā)生成式AI應(yīng)用,也需要強(qiáng)大的AI算力基礎(chǔ)、高質(zhì)量數(shù)據(jù)以及微調(diào)技術(shù)。
由于監(jiān)管機(jī)構(gòu)和各種法案的原因,Meta一直在推遲405B系列模型的發(fā)布。那么,本次泄漏是否是Meta特意放出來(lái)的呢,因?yàn)檫@是他們的老傳統(tǒng)了,去年的Llama模型就干過(guò)一次,
當(dāng)時(shí)「AIGC開(kāi)放社區(qū)」也測(cè)試過(guò),確實(shí)就是他的原模型。期待一波明天,看看Meta還能整啥花活。
以上就是關(guān)于【Meta的Llama-3.1-405B遭泄漏,可下載,性能超GPT-4o!】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!