谷歌推創(chuàng)新框架AGREE 可增強(qiáng)大模型生成內(nèi)容準(zhǔn)確性
相信很多大家對谷歌推創(chuàng)新框架AGREE 可增強(qiáng)大模型生成內(nèi)容準(zhǔn)確性還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
站長之家(ChinaZ.com)6月11日 消息:谷歌研究院推出了一個名為AGREE的創(chuàng)新框架,旨在增強(qiáng)大型語言模型(LLM)生成內(nèi)容和引用的準(zhǔn)確性。這一框架通過檢索文檔中的相關(guān)段落來增強(qiáng)大模型生成回答的事實(shí)基礎(chǔ),并提供相應(yīng)的引用,從而提高回答的準(zhǔn)確性,并為用戶提供驗(yàn)證信息真實(shí)性的途徑。
核心技術(shù):
訓(xùn)練階段微調(diào):使用基礎(chǔ)大模型生成回答,并利用自然語言推理模型(NLI)評估段落是否支持特定聲明。AGREE框架使用NLI模型從未標(biāo)記的查詢中自動構(gòu)建訓(xùn)練數(shù)據(jù)集,通過匹配回答和檢索到的文檔,為每個聲明找到最相關(guān)的支持性段落。
測試時自適應(yīng):一種動態(tài)、迭代的推理增強(qiáng)方法,幫助大模型在面對新的內(nèi)容查詢時,主動從大型語料庫中檢索相關(guān)信息,并對生成的回答進(jìn)行補(bǔ)充和修正。
AGREE的工作流程:
在微調(diào)階段,AGREE框架采用LORA的輕量級微調(diào)技術(shù),通過在大模型的權(quán)重矩陣上添加低秩更新,實(shí)現(xiàn)高效且針對性的調(diào)整,減少計(jì)算資源消耗,同時保持模型泛化能力。
測試時自適應(yīng)從接收到新查詢開始,微調(diào)后的大模型根據(jù)訓(xùn)練階段學(xué)到的知識生成初步回答,然后進(jìn)入自動迭代過程,自我評估并識別需要額外支持的聲明。
一旦識別出需要額外信息的聲明,啟動檢索過程,在預(yù)構(gòu)建的語料庫中搜索相關(guān)段落,并將這些段落與先前回答結(jié)合,生成更完善、準(zhǔn)確的內(nèi)容。
實(shí)驗(yàn)結(jié)果:
研究人員在Llama-2-13b等知名大模型上進(jìn)行了實(shí)驗(yàn),結(jié)果顯示AGREE在提升內(nèi)容回答準(zhǔn)確性和引用性方面表現(xiàn)突出。
論文地址:https://arxiv.org/pdf/2311.09533
以上就是關(guān)于【谷歌推創(chuàng)新框架AGREE 可增強(qiáng)大模型生成內(nèi)容準(zhǔn)確性】的相關(guān)內(nèi)容,希望對大家有幫助!