在2024世界機(jī)器人大會(huì)上,27款人形機(jī)器人進(jìn)行了整機(jī)展示,數(shù)量創(chuàng)歷屆之最。記者在現(xiàn)場(chǎng)看到,幾乎每個(gè)人形機(jī)器人的展位都圍滿了觀眾。
除了與人外表相似之外,人形機(jī)器人在工業(yè)和商業(yè)等場(chǎng)景已有廣泛應(yīng)用。人形機(jī)器人如何在不同場(chǎng)景中完成工作任務(wù)?人形機(jī)器人與人的互動(dòng)如何實(shí)現(xiàn)?在上崗前,它們需要經(jīng)過哪些“考試”?
上崗工作:基于模型的運(yùn)動(dòng)控制或通過模仿學(xué)習(xí)
2024世界機(jī)器人大會(huì)上,中國(guó)兵器裝備集團(tuán)自動(dòng)化研究所有限公司展出了D11智能人形機(jī)器人,這款機(jī)器人具備擬人的形態(tài)、移動(dòng)能力和操作能力,今年7月進(jìn)入一家3C智能制造企業(yè)產(chǎn)業(yè)園內(nèi)的5G+工業(yè)互聯(lián)網(wǎng)生產(chǎn)線,承擔(dān)物料搬運(yùn)、掃碼貼簽等工作。
D11智能人形機(jī)器人正在搬運(yùn)物料。受訪者供圖
“以工業(yè)制造場(chǎng)景中常見的掃碼、貼標(biāo)工序?yàn)槔诵螜C(jī)器人通過視覺對(duì)目標(biāo)物進(jìn)行識(shí)別,并反饋位置信息,控制機(jī)器人的手臂進(jìn)行抓取、粘貼、掃描等一系列動(dòng)作。”中國(guó)兵器裝備集團(tuán)自動(dòng)化研究所有限公司工程師張嘯甫表示,人形機(jī)器人有兩種方式完成這些操作,一種是基于模型的運(yùn)動(dòng)控制,另一種則是通過模仿學(xué)習(xí)進(jìn)行訓(xùn)練。
“基于模型的運(yùn)動(dòng)控制,需要設(shè)計(jì)一些程序讓機(jī)器人完成識(shí)別、抓取、放置等動(dòng)作,屬于硬編碼,關(guān)鍵在于算法控制精度、環(huán)境感知精度等方面?!睆垏[甫介紹,人形機(jī)器人通過這種方式完成任務(wù)的穩(wěn)定可靠性較高,但在泛化性方面有所局限,即一旦工作場(chǎng)景和任務(wù)內(nèi)容改變,就需要重新編碼設(shè)計(jì),且面對(duì)較復(fù)雜的操作任務(wù)時(shí),開發(fā)任務(wù)較繁重。
D11智能人形機(jī)器人正在掃碼貼簽。受訪者供圖
模仿學(xué)習(xí)在跨任務(wù)推廣、復(fù)雜技能泛化方面優(yōu)勢(shì)突出,但前期數(shù)據(jù)采集和穩(wěn)定訓(xùn)練難度較大,目前難以穩(wěn)定、可靠地完成任務(wù)。模仿學(xué)習(xí)前期通過遙操作等方式,讓人形機(jī)器人在復(fù)雜場(chǎng)景下完成演示任務(wù),并收集過程數(shù)據(jù),“比如關(guān)節(jié)數(shù)據(jù)、圖像數(shù)據(jù)等,將這些信息積累成龐大的數(shù)據(jù)集,再用數(shù)據(jù)集進(jìn)行訓(xùn)練,讓機(jī)器人‘理解’如何在不同場(chǎng)景中完成操作任務(wù)。只要將這個(gè)模型訓(xùn)練出來,人形機(jī)器人就能較快投入到對(duì)應(yīng)的工作場(chǎng)景中。但是要實(shí)現(xiàn)高泛化性和高成功率,數(shù)據(jù)采集的成本目前非常高?!睆垏[甫說,這兩種方式業(yè)內(nèi)都在研發(fā),“長(zhǎng)遠(yuǎn)來看,人形機(jī)器人執(zhí)行復(fù)雜操作任務(wù),模仿學(xué)習(xí)會(huì)是未來發(fā)展的趨勢(shì),只是目前由于一些限制,無法完全把優(yōu)勢(shì)發(fā)揮出來?!?br>
與人交互:識(shí)別指令并調(diào)用大模型
在教育、文旅、商業(yè)等領(lǐng)域,人形機(jī)器人能和人打招呼,并針對(duì)特定領(lǐng)域進(jìn)行交流。例如,大會(huì)上展出的青少年孿生人形機(jī)器人“躍遷”,有著孩童的外觀,可以在兒童的啟蒙教育階段提供有情緒價(jià)值的問答內(nèi)容。EX仿生人形機(jī)器人中有一款外形是蘇軾的交互型仿生人形機(jī)器人,通過對(duì)古代文學(xué)、歷史知識(shí)、人物經(jīng)歷的深度學(xué)習(xí),能夠復(fù)現(xiàn)蘇軾的詩(shī)文和思想,可以在歷史文化景區(qū)和游客互動(dòng)。來自上海清蕓機(jī)器人有限公司的“清寶”機(jī)器人,不僅可以快速根據(jù)問題給出答案,還能在接收指令后動(dòng)嘴唱歌,并揮舞雙手做出舞蹈動(dòng)作。
8月21日,小朋友和身著漢服的人形仿生機(jī)器人“蘇軾”打招呼。新京報(bào)記者 李木易 攝
上海清蕓機(jī)器人有限公司副總裁張杰東告訴記者,對(duì)大模型的調(diào)用,是人形機(jī)器人實(shí)現(xiàn)與人交互的關(guān)鍵。在語音交互過程中,人形機(jī)器人接收人的語音指令,將其轉(zhuǎn)化成文本指令,再調(diào)用大模型中的文本指令實(shí)現(xiàn)語音輸出,達(dá)成與人對(duì)話的目的。交互中伴隨的表情和動(dòng)作,也是相同的實(shí)現(xiàn)路徑。
“這個(gè)過程雖然有好幾個(gè)步驟,但我們?nèi)诵螜C(jī)器人的反饋速度很快,大模型的調(diào)用通常能在1秒左右完成,如果網(wǎng)絡(luò)存在延遲,可能會(huì)是2秒左右,基本上和人在交流中的反饋速度相當(dāng)。”張杰東表示,“大模型需要不斷修正和完善,我們的人機(jī)交互技術(shù)已經(jīng)過三年迭代,達(dá)到業(yè)內(nèi)優(yōu)秀水平?!?/p>
崗前考試:重要部位逐項(xiàng)測(cè)試
人形機(jī)器人在“上崗”之前需要完成一系列“考試”,考試環(huán)節(jié)設(shè)計(jì)有核心零件、運(yùn)動(dòng)控制、適應(yīng)性與可靠性、智能化、安全性能、通信性能等多個(gè)方面。
和人一樣,關(guān)節(jié)、手指等都是人形機(jī)器人身體的一部分,要讓機(jī)器人“健康”,每個(gè)部分的“考試”都得達(dá)標(biāo)。
記者從北京具身智能機(jī)器人創(chuàng)新中心了解到,人形機(jī)器人一體化關(guān)節(jié)作為機(jī)器人運(yùn)動(dòng)系統(tǒng)的核心部件,其性能直接影響機(jī)器人的整體表現(xiàn),包括動(dòng)作精準(zhǔn)度、靈活性、安全性及能效等,因此技術(shù)人員要對(duì)機(jī)器人的關(guān)節(jié)開展一系列測(cè)試,包括絕對(duì)定位精度、重復(fù)定位精度、穩(wěn)態(tài)誤差、振動(dòng)等。
據(jù)介紹,當(dāng)前技術(shù)下,人形機(jī)器人一體化關(guān)節(jié)的絕對(duì)定位精度普遍較高,一般而言,高端機(jī)器人關(guān)節(jié)的絕對(duì)定位精度可達(dá)到0.01°-0.1°,甚至部分頂尖產(chǎn)品能達(dá)到0.001°或更高的精度。這種高精度確保了人形機(jī)器人在執(zhí)行精細(xì)操作時(shí)的準(zhǔn)確性和可靠性。
在現(xiàn)有技術(shù)條件下,人形機(jī)器人一體化關(guān)節(jié)的重復(fù)定位精度通常優(yōu)于絕對(duì)定位精度,高端機(jī)型的重復(fù)定位精度可達(dá)到0.005°以內(nèi)。這意味著機(jī)器人在多次執(zhí)行相同動(dòng)作時(shí),能夠保持極高的位置一致性,從而提高工作效率和產(chǎn)品質(zhì)量。
隨著機(jī)器人產(chǎn)業(yè)的不斷發(fā)展,機(jī)器人的“手”越來越靈活,測(cè)試人員對(duì)其的測(cè)試也十分嚴(yán)格,測(cè)試主要包括抓握力量、動(dòng)作精度和靈活性。通過對(duì)這些指標(biāo)的測(cè)試和優(yōu)化,可以顯著提升人形機(jī)器人的任務(wù)執(zhí)行能力、精度和適應(yīng)性,擴(kuò)展其應(yīng)用領(lǐng)域和場(chǎng)景。
8月21日,“天工”人形機(jī)器人在和觀眾一起巡館。新京報(bào)記者 李木易 攝
“天工”是本次機(jī)器人大會(huì)的明星機(jī)器人,其引人矚目的能力是可以穩(wěn)定小跑,同時(shí)具備爬坡等能力,讓它更像人類。在這些能力的背后,機(jī)器人需要完成一系列運(yùn)動(dòng)控制測(cè)試,比如行走、奔跑、攀越、跳躍、蹲起、轉(zhuǎn)彎、可通行性和腿部靈活性。人形機(jī)器人不僅要走得穩(wěn),還得走得巧,這就意味著機(jī)器人得學(xué)會(huì)轉(zhuǎn)彎。在機(jī)器人的轉(zhuǎn)彎能力測(cè)試中,包括了特定的轉(zhuǎn)彎類型,比如U形轉(zhuǎn)彎、三點(diǎn)轉(zhuǎn)彎和L形轉(zhuǎn)彎。
“上崗”前有了新“考場(chǎng)”
人形機(jī)器人崗前考試的“考場(chǎng)”既可以在研發(fā)機(jī)構(gòu),也可以在測(cè)評(píng)中心。國(guó)家機(jī)器人檢測(cè)與評(píng)定中心(總部)北京測(cè)評(píng)中心在本次機(jī)器人大會(huì)期間全新亮相,它同樣是人形機(jī)器人“上崗”前的“考場(chǎng)”之一。
該中心負(fù)責(zé)人柴熠介紹,北京測(cè)評(píng)中心智能化評(píng)價(jià)試驗(yàn)室一期建成了智能感知、認(rèn)知決策試驗(yàn)室和交互試驗(yàn)室。目前感知試驗(yàn)室可依據(jù)相關(guān)標(biāo)準(zhǔn)要求,開展機(jī)器人視覺算法測(cè)試和視覺模擬測(cè)試?!耙曈X是機(jī)器人重要的感知方式。視覺算法測(cè)試是通過連接被測(cè)樣品,導(dǎo)入算法模型,依據(jù)被測(cè)樣品的應(yīng)用場(chǎng)景,選擇對(duì)應(yīng)測(cè)試數(shù)據(jù)集進(jìn)行視覺算法測(cè)試,測(cè)試系統(tǒng)會(huì)自動(dòng)輸出視覺算法智能等級(jí)測(cè)試結(jié)果。”
移動(dòng)能力是不同應(yīng)用場(chǎng)景中機(jī)器人最重要的認(rèn)知決策能力。在認(rèn)知決策試驗(yàn)室,機(jī)器人將進(jìn)行移動(dòng)算法測(cè)試和移動(dòng)實(shí)物測(cè)試。
交互能力對(duì)人形機(jī)器人或室外移動(dòng)機(jī)器人都至關(guān)重要。在交互試驗(yàn)室,人形機(jī)器人將開展交互能力的測(cè)試評(píng)價(jià),包括上肢測(cè)試系統(tǒng)和下肢測(cè)試系統(tǒng)。柴熠介紹,上肢測(cè)試系統(tǒng)可測(cè)試人形機(jī)器人在與人類交互時(shí)的操作交互性能、力控性能及柔順性能等,通過一系列參數(shù)指標(biāo),評(píng)估人與人形機(jī)器人交互的安全性、柔順性和智能化。
新京報(bào)記者 葉紅梅 吳婷婷
編輯 白爽 校對(duì) 楊許麗