日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

      <td id="p7kjh"></td>
      <td id="p7kjh"></td>

      首頁 > 精選經(jīng)驗 >

      一個可以提高家庭助理社交智能的框架

      發(fā)布時間:2023-02-01 17:54:31來源:

      現(xiàn)有的人工智能代理和機(jī)器人只有在被明確指示時才幫助人類。換句話說,他們不會直觀地確定在特定時刻如何提供幫助,而是等待人類告訴他們需要什么幫助。

      麻省理工學(xué)院(MIT)的研究人員最近開發(fā)了NOPA(神經(jīng)引導(dǎo)的在線概率援助),這是一個框架,可以讓人工代理自主確定如何在不同時間最好地幫助人類用戶。該框架在arXiv上預(yù)先發(fā)表的一篇論文中介紹,并計劃在ICRA 2023上發(fā)表,可以使機(jī)器人和家庭助理的開發(fā)更具響應(yīng)性和社交智能性。

      “我們有興趣研究可以幫助人類在模擬家庭環(huán)境中完成任務(wù)的代理,以便最終這些代理可以成為幫助人們在家中的機(jī)器人,”進(jìn)行這項研究的研究人員之一Xavier Puig告訴Tech Xplore。“為了實現(xiàn)這一目標(biāo),一個大問題是如何向這些代理指定我們希望他們幫助我們完成的任務(wù)。一種選擇是通過語言描述或演示來指定此任務(wù),但這需要人類用戶進(jìn)行額外的工作。

      普伊格和他的同事最近工作的過度目標(biāo)是構(gòu)建人工智能驅(qū)動的代理,可以同時推斷人類用戶試圖解決的任務(wù)并適當(dāng)?shù)貛椭麄儭K麄儗⑦@個問題稱為“在線觀察和幫助”。

      可靠地解決這個問題可能很困難。造成這種情況的主要原因是,如果機(jī)器人過早開始幫助人類,它可能無法認(rèn)識到人類總體上想要實現(xiàn)的目標(biāo),因此它對任務(wù)的貢獻(xiàn)可能會適得其反。

      “例如,如果人類用戶在廚房里,機(jī)器人可能會試圖幫助他們將餐具存放在櫥柜中,而人類想要擺桌子,”普伊格解釋說。“但是,如果代理人等待太久才能了解人類的意圖是什么,那么他們可能為時已晚。在上面概述的情況下,我們的框架將允許機(jī)器人代理通過遞上盤子來幫助人類,無論這些盤子是做什么用的。

      從本質(zhì)上講,研究人員創(chuàng)建的框架不是預(yù)測人類用戶試圖解決的單個目標(biāo),而是允許代理預(yù)測一系列目標(biāo)。這反過來又允許機(jī)器人或人工智能助手以符合這些目標(biāo)的方式提供幫助,而無需等待太長時間。

      “像Alexa這樣的普通家庭助理只有在被要求時才會提供幫助,”進(jìn)行這項研究的另一位研究員舒天民告訴Tech Xplore。“然而,人類可以以更復(fù)雜的方式互相幫助。例如,當(dāng)你看到你的伴侶帶著沉重的袋子從雜貨店回家時,你可以直接幫助他們拿這些袋子。如果你等到你的伴侶要求你幫忙,那么你的伴侶可能不會高興。

      大約二十年前,馬克斯·普朗克進(jìn)化人類學(xué)研究所的研究人員表明,人類幫助有需要的人的天生傾向很早就發(fā)展起來了。在一系列實驗中,年僅18個月大的孩子可以準(zhǔn)確地推斷出他人的簡單意圖,并幫助他們實現(xiàn)目標(biāo)。

      利用他們的框架,Puig,Shu和他們的同事希望為家庭助理配備這些相同的“幫助能力”,使他們能夠通過觀察它們來自動推斷人類試圖做什么,然后以適當(dāng)?shù)姆绞讲扇⌒袆?。這樣,人類將不再需要不斷地向機(jī)器人發(fā)出指令,而可以簡單地專注于手頭的任務(wù)。

      “NOPA是一種同時推斷人類目標(biāo)并幫助他們實現(xiàn)這些目標(biāo)的方法,”Puig和Shu解釋說。“為了推斷目標(biāo),我們首先使用一個神經(jīng)網(wǎng)絡(luò),根據(jù)人類所做的事情提出多個目標(biāo)。然后,我們使用一種稱為逆向規(guī)劃的推理方法來評估這些目標(biāo)。這個想法是,對于每個目標(biāo),我們可以想象人類為實現(xiàn)該目標(biāo)而采取的理性行動是什么;如果想象的行動與觀察到的行動不一致,我們拒絕該目標(biāo)提案。

      從本質(zhì)上講,NOPA框架不斷維護(hù)一組人類可能試圖解決的可能目標(biāo),隨著新的人類行為的觀察,不斷更新這一集。在不同的時間點,幫助計劃者會搜索一個共同的子目標(biāo),這將是解決所有當(dāng)前可能目標(biāo)集的一步。最后,它尋找有助于實現(xiàn)這一次級目標(biāo)的具體行動。

      “例如,目標(biāo)可能是把蘋果放在冰箱里,或者把蘋果放在桌子上,”普伊格和舒說。“我們的人工智能助手不會隨機(jī)猜測目標(biāo)位置并在那里放蘋果,而是會撿起蘋果并將它們交付給人類。通過這種方式,我們可以避免因幫助實現(xiàn)錯誤的目標(biāo)而破壞環(huán)境,同時仍然為人類節(jié)省時間和精力。

      到目前為止,Puig,Shu和他們的同事在模擬環(huán)境中評估了他們的框架。雖然他們期望它允許代理在目標(biāo)不明確的情況下幫助人類用戶,但他們沒有預(yù)料到他們在模擬中觀察到的一些有趣的行為。

      “首先,我們發(fā)現(xiàn)代理商能夠糾正他們的行為,以盡量減少對房屋的干擾,”普伊格解釋說。“例如,如果他們挑選了一個物體,后來發(fā)現(xiàn)該物體與任務(wù)無關(guān),他們會將物體放回原來的地方以保持房屋整潔。其次,當(dāng)不確定目標(biāo)時,智能體會選擇通常有用的行動,而不管人類的目標(biāo)如何,例如將盤子交給人類,而不是承諾將其帶到桌子或儲物柜中。

      在模擬中,Puig,Shu及其同事創(chuàng)建的框架取得了非常有希望的結(jié)果。即使團(tuán)隊最初調(diào)整了輔助代理以協(xié)助代表人類用戶的模型(以節(jié)省實際測試的時間和成本),也發(fā)現(xiàn)代理在與真實人類交互時實現(xiàn)了類似的性能。

      未來,NOPA框架可以幫助提高現(xiàn)有和新開發(fā)的家庭助理的能力。此外,它可能會激發(fā)創(chuàng)建類似的方法,以創(chuàng)建更直觀和社會協(xié)調(diào)的AI。

      “到目前為止,我們只在具體模擬中評估了該方法,”Shu補(bǔ)充道。“我們現(xiàn)在想將這種方法應(yīng)用于真實家庭中的真實機(jī)器人。此外,我們希望將口頭交流納入框架,以便AI助手可以更好地幫助人類。

      免責(zé)聲明:本文為轉(zhuǎn)載,非本網(wǎng)原創(chuàng)內(nèi)容,不代表本網(wǎng)觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。