為什么斯坦福大學生要抄襲中國大模型?
相信很多大家對為什么斯坦福大學生要抄襲中國大模型?還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
“他們會設法復制一切,卻無法復制我的思想,我讓他們辛苦偷竊,卻永遠落后我一年半載?!薄猂udyard Kipling(印度作家)
美國大模型抄襲了中國?
6月初,一些眼尖的網(wǎng)友發(fā)現(xiàn),一個來自美國斯坦福大學的AI團隊于5月29日發(fā)布了一款名為Llama3V的大模型,號稱只要500美元就能訓練出一個 SOTA多模態(tài)模型,且效果比肩OpenAI的GPT-4V、谷歌DeepMind開發(fā)的Gemini Ultra與Anthropic目前能力最強的模型Claude Opus。
然而,經(jīng)過網(wǎng)友仔細查驗,這款大模型疑似抄襲、“套殼”一家由中國大模型公司面壁智能的開源成果——MiniCPM-Llama3-V2.5,后者是在5月中旬發(fā)布的。
所謂“套殼”,深度科技研究院院長張孝榮對小巴解釋道:“通常是指在不改變核心算法和架構的情況下,對模型進行一些表面的調(diào)整或包裝,并聲稱是原創(chuàng)?!?/p>
FutureLabs未來實驗室首席專家胡延平進一步科普表示:模型開源本身就意味著開放給他人使用,可以說所有基于開源大模型的微調(diào)等二次開發(fā)都是在套殼。
區(qū)別在于,是明確聲稱基于別人的開源大模型來做——一個比較流行的規(guī)范做法是明示:同時感謝或致敬。
但很多只眼睛看了又看斯坦福團隊的Llama3V后發(fā)現(xiàn),并沒有相關標識。
據(jù)雷鋒網(wǎng)的觀察,一開始,由于這款產(chǎn)品的主創(chuàng)團隊有斯坦福背景,又集齊了特斯拉、SpaceX、亞馬遜與牛津大學等機構的相關經(jīng)歷,因此模型發(fā)布后備受矚目。
發(fā)現(xiàn)不對勁后,6月2日,網(wǎng)友試圖在Llama3V的Github項目下拋出事實性質(zhì)疑,但很快被Llama3V的團隊刪除,網(wǎng)友被這種不坦誠的舉動激怒,開始在論壇公開曝光,并提醒面壁智能團隊“打假”。
被抄襲方面壁智能是一家已完成數(shù)億元融資的國內(nèi)知名創(chuàng)業(yè)公司,擁有100多名研發(fā)人員,其中80%來自清華北大。
6月2日,面壁智能團隊深夜回應,MiniCPM-Llama3-V2.5曾被用于識別清華大學藏戰(zhàn)國竹簡(后簡稱“清華簡”)上的戰(zhàn)國古文字,團隊花費數(shù)月在清華簡上逐字掃描并人工標注,且從未對外公開。
然而,測試后團隊發(fā)現(xiàn),斯坦福的模型不僅能識別出“清華簡”中的戰(zhàn)國古文字,而且連錯誤的識別結(jié)果都與MiniCPM模型完全一致,由此坐實抄襲。
消息傳到國內(nèi),一石激起千層浪。
臥龍抄襲了鳳雛?
這次的抄襲事件之所以備受矚目,在于事件主角的特殊性:斯坦福大學和清華大學,以及一些“意外感”加持——是美國團隊抄襲了中國團隊(細想反而有些心酸)。
根據(jù)AMiner發(fā)布的《全球十個大模型核心團隊成員分析報告》,十款全球著名的大模型GPT、Gemini、Claude、GLM、LLaMA、Qwen、Falcon、PaLM、BERT、T5的全部核心成員中,大都經(jīng)過加州大學系統(tǒng)和斯坦福大學培養(yǎng),而清華大學是其中唯一一所上榜的中國高校。
*小巴注:加州大學不是一所大學,而是由加州的公立大學所組成的大學系統(tǒng),分別位于加州不同的市,但十所不同的分校大多都有名。
此外,熟悉大模型行業(yè)的有心人會發(fā)現(xiàn),國內(nèi)大模型的公司介紹里,往往會強調(diào):公司的七成到九成都是研發(fā)人員,而必要時,他們還會寫上清華創(chuàng)始團隊。
甚至在斯坦福自己發(fā)布的《2024年人工智能指數(shù)報告》中,在討論全球AI模型時,清華大學成為被提及為非西方機構中發(fā)布基礎模型數(shù)量最多的學術機構之一。
由此,這次事件似乎發(fā)展成了“美國臥龍抄襲了中國鳳雛”的走向,引發(fā)熱議也就不足為奇了。
但從身份上細看,兩個團隊卻有明顯差距。
6月2日,斯坦福團隊其中一名成員Aksh Garg(加格)在社交平臺X上正式道歉,并對本次事件公開道歉,并進行了解釋,他的推文稱之所以會如此,主要是他們“信錯了豬隊友”。
據(jù)其原文,抄襲團隊共有三位美國年輕人,Siddharth Sharma(夏爾馬)、Aksh Garg(加格)、Mustafa Aljadery(阿爾賈德里)。
夏爾馬和加格是斯坦福大學本科生,主要負責Llama3-V模型的宣傳推廣。阿爾賈德里是畢業(yè)于南加州大學的年輕創(chuàng)業(yè)者,主要負責Llama3-V模型的代碼開發(fā)。在Llama3-V模型開發(fā)過程中,阿爾賈德里為了快速出名,抄襲了來自中國的MiniCPM-Llama3-V2.5大模型。
我們翻了翻另一位成員夏爾馬以往的推文,如其所言,他確實是一位技術圈的KOL(意見領袖),給很多產(chǎn)品做過宣傳,不只是Llama3-V。
因此事件的實質(zhì),是南加州大學背景的人抄襲了清華背景的大模型。
而面壁智能一邊,他的聯(lián)合創(chuàng)始人兼首席科學家是劉知遠。
據(jù)官網(wǎng)介紹,劉知遠在人工智能領域著名國際期刊和會議發(fā)表相關論文200余篇,Google Scholar統(tǒng)計引用超過3.1萬次,曾獲教育部自然科學一等獎。
他的老師孫茂松的頭銜更長——歐洲人文和自然科學院外籍院士,國際計算語言學協(xié)會會士,中國人工智能學會會士,中國中文信息學會會士,清華大學計算機科學與技術系長聘教授、博士生導師——同時也是桃李滿天下,包括劉知遠在內(nèi)的三個學生同時都是國內(nèi)知名AI創(chuàng)業(yè)公司的成員。
實際上,出自明星團隊的面壁MiniCPM-Llama3-V2.5大模型在中國AI界頗有知名度,但大部分美國人并不知道。
界面報道中就提到,針對此事,谷歌DeepMind研究員Lucas Beyer在點評此事時說,有同樣表現(xiàn)的MiniCPM-Llama3-V2.5得到了太少的關注,而這似乎僅僅因為這個模型不是來自一所“美國常青藤名?!?。
因此,事件最終發(fā)展成了一場鬧劇——一些有斯坦福大學和加州大學背景的草臺班子,利用中美之間的信息差,抄襲了中國尖端研究團隊的作品。
當事人劉知遠,在斯坦福團隊道歉后的一天,在知乎感慨道:
“你中有我,我中有你”
梳理完事件的來龍去脈,大家或許會感慨,事情的真相,似乎與人們看到新聞時,第一時間腦補的“中國清華系與美國斯坦福系的PK大賽”“中國的大模型崛起了”劇情走向有著很大的距離。
但情緒的落差也未必真有這么大。
胡延平就認為,這件事之所以引起廣泛關注,主要在于“反向抄襲”這類情況比較少見。以往國內(nèi)AI團隊基于國外開源大模型來開發(fā)的比較多,國外團隊使用國內(nèi)大模型來開發(fā)的很少見。說明國產(chǎn)大模型雖然整體落后,但局部也有可圈可點之處。
比胡延平更有信心的專家則表達了不同的看法。
一位業(yè)內(nèi)人士在看完這個事件后就對小巴感嘆:“單就大語言模型來說,我一直相信中美差距會縮小,但美國會出新東西。而這個事情,確實可以說明中美在大語言模型上的差距正在縮小,技術層面上至少可以證明你中有我、我中有你?!?/p>
張孝榮也表示,斯坦福團隊抄襲中國團隊的行為確實可以反映出中國團隊在大模型應用開發(fā)領域,處于基本與美國相當?shù)乃健?/p>
不過,此事件另一個值得留意的地方,是本次事件中作為“發(fā)現(xiàn)者”“曝光者”以及“提醒者”的有心網(wǎng)友。
如果沒有他們對于新大模型產(chǎn)品的嚴格審查,第一時間的質(zhì)疑與提醒,這件事恐怕也很難從一個小眾的領域里這么快破圈而出。
“只要眼睛多,bug容易捉?!边@是1999年出版的《大教堂與集市》一書中的一句話,也是本書的核心奧義。
這個書名人文氣息濃郁的作品,被稱作互聯(lián)網(wǎng)開源運動的“圣經(jīng)”。
作者Eric S·Raymond埃里克·雷蒙在二十多年前,倡議用“集市”模式開放源代碼,鼓勵全球的軟件開發(fā)者一起參與開發(fā)軟件,從而取代過去大公司閉門造車的“大教堂”模式。
換言之,是成千上萬的臭皮匠能頂一個諸葛亮。
他的預言成了我們的現(xiàn)實,他的理念是我們習以為常的價值觀——如今人們所使用的所有軟件、網(wǎng)絡、操作系統(tǒng)無一不是開源下發(fā)展而來的產(chǎn)品。
開源貫穿互聯(lián)網(wǎng)發(fā)展的始終,也延綿到了人工智能時代,幸好,雷蒙的“眼睛多”定律,不止有助于發(fā)現(xiàn)bug,也有助于發(fā)現(xiàn)抄襲。
這次事件,在某種程度上也讓我們再次感受到了來自互聯(lián)網(wǎng)開放精神的魅力,從某種意義上來說,這個斯坦福團隊犯得最大的錯,在于他們利用了互聯(lián)網(wǎng)的開放性,卻忽略了開放性的另一個重要特點:全民監(jiān)督。
事后,就有網(wǎng)友疑惑評論:“難道他們不怕被發(fā)現(xiàn)么?”
也許,再開放的世界,也敵不過一個自我封閉的大腦和視野。
以上就是關于【為什么斯坦福大學生要抄襲中國大模型?】的相關內(nèi)容,希望對大家有幫助!