從ALOHA邁向Humanplus,斯坦福開源人形機器人,「高配版人類」上線
相信很多大家對從ALOHA邁向Humanplus,斯坦福開源人形機器人,「高配版人類」上線還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
說起前段時間斯坦福開源的 Mobile ALOHA 全能家務(wù)機器人,大家肯定印象深刻,ALOHA 做起家務(wù)活來那是有模有樣:滑蛋蝦仁、蠔油生菜、干貝燒雞,一會兒功夫速成大餐:
研究團隊來自斯坦福,由三個人共同打造完成。Zipeng Fu 為項目共同負(fù)責(zé)人,他是斯坦福大學(xué) AI 實驗室的計算機科學(xué)博士生,師從 Chelsea Finn 教授;Tony Z. Zhao 也是斯坦福大學(xué)的計算機科學(xué)博士生,導(dǎo)師也是 Chelsea Finn。
現(xiàn)在,繼 ALOHA 之后,Zipeng Fu、Chelsea Finn 等人又聯(lián)合推出了一款新的機器人研究 HumanPlus,不過這次 Tony Z. Zhao 沒有出現(xiàn)在作者欄里,而是在致謝名單上。
HumanPlus 團隊成員。
這款機器人能夠自主的疊衣服,然而即使是2倍速,動作看起來也是慢吞吞:
充當(dāng)倉庫的搬運工,準(zhǔn)確的將物品放置在機器狗背上的籃子里:
給大家表演個向后跳的節(jié)目,就像人類一樣,扎個馬步讓自己穩(wěn)妥一點:
可能你都不會彈的鋼琴,但這次機器人會了,它不是亂彈一通,仔細(xì)聽還能聽出旋律來:
化身你的乒乓球搭子,來上幾個回合沒有問題:
像個電腦新手一樣,在鍵盤上努力的敲出「HELLO WORLD」
打起拳來也是有模有樣
值得一提的是,這次斯坦福團隊公布了論文、機器人材料清單、數(shù)據(jù)集以及代碼。正如 Tony Z. Zhao 所表示的「這是唯一一篇完全開源的論文,雖然我們處在一個前沿的研究時代,但充滿了閉源、競爭等其他因素的限制,這個領(lǐng)域需要更多開放的科學(xué),而不是酷炫的演示?!?/p>
根據(jù)材料清單我們推測完成機器人組裝大約花費107,945美元。
研究介紹
論文地址:https://humanoid-ai.github.io/
論文標(biāo)題:HumanPlus: Humanoid Shadowing and Imitation from Humans
長期以來,人形機器人因其類似人的形態(tài)而備受關(guān)注。這主要得益于我們周圍的環(huán)境、工具等都是依據(jù)人類形態(tài)而設(shè)計的,因此人類大小的機器人在解決人類從事的任務(wù)上潛力巨大。
通過模仿人類,人形機器人為實現(xiàn)通用機器人智能提供了一個充滿希望的途徑。
然而,在實際操作中,要讓人形機器人從以自我為中心的視角學(xué)習(xí)自主技能仍然面臨挑戰(zhàn)。這主要是因為人形機器人在感知和控制方面的復(fù)雜性,以及其在形態(tài)結(jié)構(gòu)和執(zhí)行機制上與人類之間仍存在的物理差異。此外,還缺乏一套數(shù)據(jù)處理流程,可以讓人形機器人通過以自我為中心的視角學(xué)習(xí)自主技能。
基于此,斯坦福團隊開發(fā)了一個全棧系統(tǒng),用于人形機器人從人類數(shù)據(jù)中學(xué)習(xí)運動和自主技能。該研究首先基于40小時的人體運動數(shù)據(jù)集,通過強化學(xué)習(xí)在模擬環(huán)境中訓(xùn)練低級策略。然后將這一策略遷移到現(xiàn)實世界中,從而允許人形機器人僅使用 RGB 相機實時跟蹤人體和手部運動,稱為 Shadowing 系統(tǒng)。
通過 Shadowing,人類操作員可以遠(yuǎn)程操作人形機器人來收集全身數(shù)據(jù),以便在現(xiàn)實世界中學(xué)習(xí)不同的任務(wù)。基于收集到的數(shù)據(jù),隨后進行有監(jiān)督的行為克隆,使用以自我為中心的視角來訓(xùn)練機器人的技能策略,使人形機器人能夠通過模仿人類的技能自主完成不同任務(wù)。
研究者在定制的33自由度、高180cm 的人形機器人上演示了該系統(tǒng),通過多達(dá)40次演示,該系統(tǒng)可以自主完成諸如穿鞋站立和行走,從倉庫貨架上卸載物品,折疊運動衫,重新排列物品,打字以及與另一個機器人打招呼等任務(wù),成功率為60-100%。
該研究團隊發(fā)布的機器人如圖2左側(cè)所示,具有33個自由度,其中包括兩個擁有6自由度的手指、兩個1自由度的手腕和一個有19自由度的身體(包含:兩個4自由度的手臂、兩個5自由度的腿和一個1自由度的腰部)。
該系統(tǒng)基于 Unitree H1機器人構(gòu)建,每只手臂集成了 Inspire-Robots RH56DFX Hand,通過定制手腕連接,其中每個手腕配有一個 Dynamixel 伺服電機和兩個推力軸承。手和手腕均通過串行通信控制。
機器人頭部安裝了兩個 RGB 網(wǎng)絡(luò)攝像頭(Razer Kiyo Pro),向下傾斜50度,瞳距為160毫米。手指可以施加高達(dá)10牛頓的力,而手臂可以舉起重達(dá)7.5公斤的物品。腿部的電機在操作過程中可以產(chǎn)生高達(dá)360Nm 的瞬時扭矩。圖2右側(cè)提供了該機器人的其他技術(shù)規(guī)格信息。
人體部分和手部動作使用 SMPL-X 模型進行參數(shù)化。為了重定向身體姿態(tài),研究人員將 SMPL-X 對應(yīng)的歐拉角復(fù)制到類人模型中,即髖部、膝蓋、腳踝、軀干、肩膀和肘部。機器人的每個髖部和肩部關(guān)節(jié)由3個正交旋轉(zhuǎn)關(guān)節(jié)組成,因此可以視為一個球形關(guān)節(jié)。機器人的手指有6個自由度:每個食指、中指、無名指和小指各1個自由度,大拇指2個自由度。為了重定向手部姿勢,他們使用中間關(guān)節(jié)的旋轉(zhuǎn)來映射每個手指的對應(yīng)歐拉角。并且通過使用前臂和手的全局方向之間的相對旋轉(zhuǎn),計算1自由度的手腕角度。
如圖3所示,身體姿勢估計和重定向在 NVIDIA RTX4090GPU 上以每秒25幀的速度運行。
實時手部姿勢估計和重定向:該團隊使用 HaMeR——一個基于 Transformer 的手部姿態(tài)估計器,通過單個 RGB 攝像頭進行實時手部姿態(tài)估計。手部姿勢估計和重定向在 NVIDIA RTX4090GPU 上以每秒10幀的速度運行。
該研究將低級策略 Humanoid Shadowing Transformer 制定為僅解碼器的 Transformer,如圖4左側(cè)所示。
在每個時間步中,策略的輸入是人形機器人的本體感知和目標(biāo)姿態(tài)。策略的輸出是人形機器人身體關(guān)節(jié)的19維關(guān)節(jié)位置設(shè)定點,這些設(shè)定點隨后通過1000Hz 的 PD 控制器轉(zhuǎn)換為扭矩。
隨機化模擬環(huán)境和人形機器人的物理參數(shù)見表2。
如圖3所示,研究者使用單個 RGB 攝像頭實時估計人體和手部姿態(tài),并將人體姿態(tài)重定向為類人目標(biāo)姿態(tài)。
如圖1所示,人類操作員站在人形機器人附近,將他們的實時全身運動投射到人形機器人上,并使用視線觀察人形機器人的環(huán)境和行為,確保遠(yuǎn)程操作系統(tǒng)反應(yīng)靈敏。
在被遠(yuǎn)程操作時,人形機器人通過雙目 RGB 攝像頭收集第一視角視覺數(shù)據(jù)。通過 shadowing,研究人員為各種現(xiàn)實場景任務(wù)提供了一條高效的數(shù)據(jù)收集管道,從而避免了模擬環(huán)境中真實 RGB 渲染、精確軟體對象模擬和多樣化任務(wù)規(guī)范的挑戰(zhàn)。
與其他遠(yuǎn)程操作方法相比,Shadowing 系統(tǒng)更具優(yōu)勢。
以上就是關(guān)于【從ALOHA邁向Humanplus,斯坦福開源人形機器人,「高配版人類」上線】的相關(guān)內(nèi)容,希望對大家有幫助!
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。 如有侵權(quán)請聯(lián)系刪除!
-
奔馳GLE作為豪華SUV市場中的佼佼者,憑借其卓越的性能、豪華的內(nèi)飾以及寬敞的空間,吸引了眾多消費者的關(guān)注。...瀏覽全文>>
-
在2025年,安徽阜陽地區(qū)的帕薩特新能源汽車市場表現(xiàn)非?;钴S。作為一款備受關(guān)注的新能源車型,帕薩特新能源憑...瀏覽全文>>
-
近日,滁州地區(qū)的大眾汽車經(jīng)銷商傳來好消息:備受矚目的2025款T-ROC探歌正式上市,并且以極具競爭力的價格吸引...瀏覽全文>>
-
在選擇一款新能源汽車時,了解其價格和配置是非常重要的一步。安徽淮南地區(qū)的長安啟源E07作為2024款的新車型,...瀏覽全文>>
-
阜陽長安啟源A05作為長安汽車旗下的全新車型,自推出以來便憑借其獨特的設(shè)計風(fēng)格和豐富的配置吸引了眾多消費者...瀏覽全文>>
-
阜陽長安啟源A07作為一款備受矚目的新能源車型,以其豪華配置和親民的價格在市場上引起了廣泛關(guān)注。這款車型不...瀏覽全文>>
-
安徽淮南威然2024款價格及配置詳解隨著汽車市場的不斷更新?lián)Q代,上汽大眾旗下的MPV車型——威然(Viloran)憑...瀏覽全文>>
-
QQ多米新車報價2025款,買車省錢秘籍隨著汽車市場的不斷發(fā)展,消費者在選購車輛時不僅關(guān)注車型的性能和配置,...瀏覽全文>>
-
滁州途觀X 2024款最新價格及買車省錢秘籍隨著汽車市場的不斷發(fā)展,大眾途觀X作為一款兼具時尚與性能的中型SUV...瀏覽全文>>
-
隨著汽車市場的不斷發(fā)展,大眾蔚攬以其優(yōu)雅的設(shè)計和卓越的性能贏得了眾多消費者的青睞。作為一款兼具實用性和...瀏覽全文>>
- Alienware 在 2025 年 CES 上展示了一些超凡脫俗的技術(shù)
- Wickes 任命首席零售和分銷官
- 分析師稱GTA 6或?qū)淞⑿袠I(yè)新標(biāo)準(zhǔn)
- 索尼和本田在拉斯維加斯推出售價 89,900 美元的 Afeela 1
- 日本 11 月游客人數(shù)創(chuàng)月度新高
- 神經(jīng)認(rèn)知測試在 3 歲兒童白血病治療期間可行
- 牛津郡小學(xué)支持圣誕毛衣日
- S?strene Grene 投資歐洲物流中心
- 有人已經(jīng)在電視上直播 BNMC 打造的 1967 年福特野馬 Restomod
- 潛在的分子療法可以逆轉(zhuǎn)小鼠的胎盤發(fā)育問題
- 奔馳GLE預(yù)約試駕,新手必看的詳細(xì)流程
- 滁州T-ROC探歌 2025新款價格,最低售價15.89萬起,趕緊行動
- 安徽淮南威然最新價格2024款,各配置車型售價全知曉
- 滁州途觀X最新價格2024款,買車省錢秘籍
- 淮南長安啟源Q05 2025新款價格,最低售價9.69萬起,入手正當(dāng)時
- 安徽淮南探影多少錢 2023款落地價,各配置車型售價一目了然
- 淮南途觀X價格大揭秘,買車前必看
- 安徽淮南長安獵手K50新款價格2025款多少錢?買車攻略一網(wǎng)打盡
- 滁州ID.4 X新款價格2025款多少錢?買車攻略一網(wǎng)打盡
- QQ多米落地價,購車前必看的費用明細(xì)
- Nvidia DLSS 4 有望將游戲性能提高 8 倍
- 人工智能在預(yù)測自身免疫性疾病進展方面顯示出良好的前景
- 心理物理實驗揭示皮膚水分感知是如何改變的
- 科茨沃爾德公司慶祝圣誕節(jié)圓滿成功
- 南法納姆學(xué)校被評為薩里郡表現(xiàn)最好的小學(xué)
- 約克區(qū)九所小學(xué)將削減招生人數(shù)
- 松下新款電動汽車電池為 Lucid Gravity 帶來 450 英里續(xù)航里程
- 泰國旅游呈現(xiàn)新趨勢
- 研究人員找到在細(xì)胞水平上餓死前列腺癌腫瘤的新方法
- 領(lǐng)先的人工智能聊天機器人在測試中表現(xiàn)出類似癡呆癥的認(rèn)知能力下降
- 龐大的 Project Zomboid build 42 終于可以玩了
- Steam Replay 回歸向您展示 2024 年您玩得最多的 PC 游戲
- Jollyes 推出強化的人才支持和招聘措施
- Karen Millen 與 Simon Harrison 共同推出全新高級珠寶系列
- 奇瑞風(fēng)云A8L電動轎車刷新續(xù)航里程世界紀(jì)錄
- 虛擬藝術(shù)家將別克 Cascada 帶回 2026 款車型
- OnePlus 宣布推出新計劃解決綠線問題
- OnePlus Watch 3 將擁有更大的電池和更薄的機身
- 研究人員發(fā)現(xiàn)可變剪接與自身免疫性疾病遺傳之間的細(xì)胞類型特異性聯(lián)系
- 科學(xué)家確定腦細(xì)胞類型是排尿的主要控制者