日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

<td id="p7kjh"></td>

<td id="p7kjh"></td>

<p id="jsa0i"><abbr id="jsa0i"><samp id="jsa0i"></samp></abbr></p>

谷歌DeepMind被曝抄襲開源成果，論文還中了頂流會(huì)議

發(fā)布時(shí)間：2024-07-15 14:00:09 編輯：來源：

導(dǎo)讀相信很多大家對(duì)谷歌DeepMind被曝抄襲開源成果，論文還中了頂流會(huì)議還不知道吧，今天菲菲就帶你們一起去了解一下~.~！大模型圈再曝抄襲大瓜...

相信很多大家對(duì)谷歌DeepMind被曝抄襲開源成果，論文還中了頂流會(huì)議還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

大模型圈再曝抄襲大瓜，這回，“被告”還是大名鼎鼎的谷歌DeepMind。

“原告”直接怒噴:他們就是把我們的技術(shù)報(bào)告洗了一遍!

具體是這么個(gè)事兒:

谷歌DeepMind一篇中了頂流新生代會(huì)議CoLM2024的論文被掛了，瓜主直指其抄襲了一年前就掛在arXiv上的一項(xiàng)研究。開源的那種。

兩篇論文探討的都是一種規(guī)范模型文本生成結(jié)構(gòu)的方法。

抓馬的是，谷歌DeepMind這篇論文中確實(shí)明晃晃寫著引用了“原告”的論文。

然鵝，即便是標(biāo)明了引用，“原告”的兩位論文作者Brandon T. Willard（布蘭登）和R′emi Louf(雷米)還是堅(jiān)稱谷歌抄襲，并認(rèn)為:

而不少網(wǎng)友看過論文后也緩緩打出一個(gè)問號(hào):CoLM是怎么審的稿?

趕緊瞅一眼論文對(duì)比……

兩篇論文的比較

先淺看一眼兩篇論文的摘要對(duì)比。

谷歌DeepMind的論文說的是，tokenization給約束語言模型輸出帶來了麻煩，他們引入自動(dòng)機(jī)理論來解決這些問題，核心是避免在每個(gè)解碼步驟遍歷所有邏輯值（logits）。

而“原告”的說法大致是:

提出了一個(gè)高效框架，通過在語言模型的詞匯表上構(gòu)建索引，來大幅提升約束文本生成的效率。簡單來說，就是通過索引避免對(duì)全部邏輯值的遍歷。

同樣“不依賴于具體模型”。

方向上確實(shí)大差不差，我們還是接著來看看更多詳細(xì)內(nèi)容。

我們用谷歌Gemini1.5Pro分別總結(jié)了兩篇論文的主要內(nèi)容，并接著讓Gemini來比較兩者的異同。

對(duì)于“被告”谷歌這篇論文，Gemini總結(jié)其方法是將detokenization重新定義為有限狀態(tài)轉(zhuǎn)換器（FST）操作。

將此FST與表示目標(biāo)形式語言的自動(dòng)機(jī)組合，這種自動(dòng)機(jī)可以用正則表達(dá)式或語法來表示。

通過以上結(jié)合，生成一個(gè)基于token的自動(dòng)機(jī)，用于在解碼過程中約束語言模型，確保其輸出的文本符合預(yù)設(shè)的形式語言規(guī)范。

此外，谷歌論文中還進(jìn)行了一系列正則表達(dá)式擴(kuò)展，這些擴(kuò)展通過使用特別命名的捕獲組來編寫，顯著提升了系統(tǒng)處理文本時(shí)的效率和表達(dá)能力。

而對(duì)于“原告”論文，Gemini總結(jié)其方法的核心是將文本生成問題重新定義為有限狀態(tài)機(jī)（FSM）之間的轉(zhuǎn)換。

“原告”的具體方法是:

利用正則表達(dá)式或上下文無關(guān)文法構(gòu)建FSM，并將其用于指導(dǎo)文本生成過程。

通過構(gòu)建詞匯表索引，高效地確定每個(gè)步驟中的有效詞，避免遍歷整個(gè)詞匯表。

Gemini列出了兩篇論文的共同點(diǎn)。

至于兩者的區(qū)別，有點(diǎn)像前頭那位網(wǎng)友說的，簡單總結(jié)就是:谷歌將詞匯表定義為了一個(gè)FST。

前面也說到了，谷歌在“Related work”中將原告論文列為“最相關(guān)”的一項(xiàng)工作:

谷歌認(rèn)為兩者的差異在于，Outlines的方法基于一種特制的“索引”操作，需要手動(dòng)擴(kuò)展到新的應(yīng)用場(chǎng)景。相比之下，谷歌使用自動(dòng)機(jī)理論徹底重新定義了整個(gè)過程，使得應(yīng)用FSA和泛化到PDA變得更加容易。

另一個(gè)區(qū)別是，谷歌定義了擴(kuò)展以支持通配符匹配，并提高了可用性。

谷歌緊接著在介紹下面的兩項(xiàng)相關(guān)工作中，也都提到了Outlines。

一項(xiàng)是Yin等人（2024年）通過增加“壓縮”文本段到預(yù)填充的功能，擴(kuò)展了Outlines。

另一項(xiàng)是Ugare等人（2024年）近期提出的一個(gè)系統(tǒng)，名為SynCode。它也利用FSA，但采用LALR和LR解析器而非PDA處理語法。

但吃瓜群眾們顯然不是很買賬:

網(wǎng)友:這事兒不罕見…

這件事一發(fā)酵，不少網(wǎng)友都怒了，抄襲可恥，更何況“科技巨頭剽竊小團(tuán)隊(duì)的工作成果不是第一次了”。

順便一提，布蘭登和雷米發(fā)布原告論文的時(shí)候都在給Normal Computing遠(yuǎn)程工作，這家AI Infra公司成立于2022年。

哦對(duì)了，Normal Computing的創(chuàng)始團(tuán)隊(duì)有一部分就來自Google Brain……

另外，布蘭登和雷米現(xiàn)在合伙出來創(chuàng)業(yè)了，新公司名叫.txt，官網(wǎng)信息顯示，其目標(biāo)是提供快速可靠的信息提取模型。并且官網(wǎng)掛出的GitHub主頁，就是Outlines倉庫。

說回到網(wǎng)友這邊，更讓大家伙兒生氣的是，“這種情況已經(jīng)變得普遍”。

一位來自荷蘭代爾夫特理工大學(xué)的博士后分享了自己的遭遇:

還有一位美國東北大學(xué)的老哥更慘，這種情況他遭遇過兩次，下手的還都是同一個(gè)組。并且對(duì)面那位第一作者還給他的GitHub加過星標(biāo)……

不過，也有網(wǎng)友表達(dá)了不同的意見:

對(duì)此，雷米怒懟:

布蘭登老哥也表示yue了:

瓜就先吃到這里，對(duì)此你有什么想法?不妨在評(píng)論區(qū)繼續(xù)討論~

兩篇論文戳這里:

谷歌DeepMind論文:https://arxiv.org/abs/2407.08103v1

原告論文:https://arxiv.org/abs/2307.09702

參考鏈接:

[1]https://x.com/remilouf/status/1812164616362832287?s=46

[2]https://x.com/karan4d/status/1812172329268699467?s=46

[3]https://x.com/brandontwillard/status/1812163165767053772?s=46

以上就是關(guān)于【谷歌DeepMind被曝抄襲開源成果，論文還中了頂流會(huì)議】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

谷歌DeepMind被曝抄襲開源成果，論文還中了頂流會(huì)議

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請(qǐng)聯(lián)系刪除！

上一篇

下一篇

相關(guān)閱讀

最近“轟炸”美國榜單的騰訊，海外發(fā)行快成了？

講故事的“電子女友”走紅，誰在為情緒需求買單？

QQ啟動(dòng)暑期未成年人網(wǎng)絡(luò)環(huán)境整治加強(qiáng)短視頻、直播場(chǎng)景治理

一代經(jīng)典落幕！谷歌宣布終止安卓5.X系統(tǒng)支持

6700萬參數(shù)比肩萬億巨獸GPT-4！微軟MIT等聯(lián)手破解Transformer推理密碼

跟年輕人互換血漿、爆改DNA后！美國富豪為長生冷凍自己和財(cái)富以備復(fù)活后使用

錢塘江驚現(xiàn)罕見的“蝴蝶潮” 網(wǎng)友：壯觀的視覺盛宴

揭秘快手可靈背后的「關(guān)鍵7人」

OPPO Watch X理想汽車定制版手表上線理想商城：深度控車取代車鑰匙

必須封殺老頭樂上路不安全！專家：農(nóng)村新能源汽車市場(chǎng)空間很大

最新文章

谷歌DeepMind被曝抄襲開源成果，論文還中了頂流會(huì)議

平行空間理論蟲洞技術(shù)研究（平行空間理論）

解曉東年齡（謝曉東）

開到荼靡是什么意思?（開到荼靡是什么意思）

樸蔡琳個(gè)人資料（樸蔡琳）

開廣告公司必備條件是什么（開廣告公司必備條件）

勞動(dòng)感受200字左右掃地（勞動(dòng)感受200字）

怎么投訴公交車司機(jī)到站不開門（怎么投訴公交車司機(jī)）

怎么投訴公交車晚點(diǎn)不發(fā)車（怎么投訴公交車）

下崗證丟失了怎么補(bǔ)辦（下崗證）

熱點(diǎn)推薦

解曉東年齡（謝曉東）

勞動(dòng)感受200字左右掃地（勞動(dòng)感受200字）

怎么投訴公交車晚點(diǎn)不發(fā)車（怎么投訴公交車）

文字聊天室哪個(gè)好（文字聊天室網(wǎng)站）

和dnf差不多的網(wǎng)絡(luò)游戲手游（和dnf差不多的網(wǎng)絡(luò)游戲）

百尺竿頭更進(jìn)一步的意思造句（百尺竿頭更進(jìn)一步的意思）

哈爾濱江北在哪個(gè)區(qū)?。ü枮I江北屬于哪個(gè)區(qū)）

刀鋒戰(zhàn)士4血神復(fù)活在線看完整版（刀鋒戰(zhàn)士4）

無視4G/5G信號(hào)打電話！中國聯(lián)通開測(cè)VoWiFi通話：不怕信號(hào)差

excel2007選擇性粘貼不了怎么辦（excel選擇性粘貼不能用）

祝你平安原唱MTV（祝你平安原唱）

賁門癌早期癥狀圖與賁門息肉圖片區(qū)別（賁門癌的早期癥狀圖）

硬路肩是哪個(gè)位置圖片（路肩是什么意思）

深圳大量魚群飛出水面當(dāng)?shù)厝耍簤延^ 持續(xù)大約一分鐘

拉克維的誘鉺（拉克維的氣味龍蛋在哪里）

精選文章

開到荼靡是什么意思?（開到荼靡是什么意思）

怎么投訴公交車司機(jī)到站不開門（怎么投訴公交車司機(jī)）

大連旅行社哪家好中山區(qū)萬達(dá)大廈電話（大連旅行社哪家好）

對(duì)比色畫畫圖片大全簡單（對(duì)比色畫）

啫喱膏的功效與作用（啫喱膏）

cmyk分別代表什么顏色PS（cmyk分別代表什么）

芳齡十六在線觀看完整版（芳齡十三）

老虎和熊誰厲害一些（老虎和熊誰厲害）

無圖NOA開啟全量推送全國都能開！理想汽車正式推送OTA 6.0

刀閘開關(guān)型號(hào)規(guī)格選型（刀閘是否開關(guān)一種）

多地發(fā)出節(jié)約用電倡議書：空調(diào)不低26度辦公場(chǎng)所電腦等要關(guān)機(jī)

長生果是什么水果（長生果）

鍍鋅鋼絞線規(guī)格型號(hào)表（鍍鋅鋼絞線規(guī)格型號(hào)）

今年流行什么服裝女裝好看（今年流行什么服裝女裝）

計(jì)提比例怎么計(jì)算（計(jì)提比例）

? 2008-2024 All Rights Reserved .新訊網(wǎng) 版權(quán)所有

網(wǎng)站地圖 | 百度地圖 | 360地圖 | 今日更新

日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

97超级碰在线观看免费亚洲免费视频在线观看69 中文字幕日本无吗在线观看一区二区三区