杭州舉行的《CMG世界機(jī)器人大賽·系列賽》機(jī)甲格斗擂臺(tái)賽上,宇樹科技以合作方身份參賽,上場(chǎng)的機(jī)器人均為宇樹G1人形機(jī)器人。
2.經(jīng)過幾輪比拼,黑隊(duì)AI策算師最終奪得冠軍,展示了較強(qiáng)的平衡控制、人機(jī)協(xié)同能力。
3.然而,機(jī)器人在實(shí)時(shí)感知方面仍存在困境,需要真正的空間智能大模型作為機(jī)器人的大腦。
4.為此,后續(xù)產(chǎn)業(yè)鏈或?qū)⒂楷F(xiàn)更多二次開發(fā)的機(jī)器人解決方案商,在公版機(jī)器人基礎(chǔ)上開發(fā)專業(yè)的大腦。
《科創(chuàng)板日?qǐng)?bào)》5月26日訊(記者 黃心怡)“左右勾拳、側(cè)踢、膝踢、閃避、跌倒起身,被KO……”一場(chǎng)機(jī)器人之間的格斗比賽在昨晚開打。
在這場(chǎng)于杭州舉行的《CMG世界機(jī)器人大賽·系列賽》機(jī)甲格斗擂臺(tái)賽上,宇樹科技以合作方身份參賽,上場(chǎng)的機(jī)器人均為宇樹 G1人形機(jī)器人,并進(jìn)行現(xiàn)場(chǎng)的手柄操控。經(jīng)過幾輪比拼,黑隊(duì)AI策算師最終奪得冠軍。
“這次比賽的格斗動(dòng)作,采集自外部專業(yè)人員,用來給AI模型提供學(xué)習(xí)參考?!庇顦淇萍枷嚓P(guān)負(fù)責(zé)人向《科創(chuàng)板日?qǐng)?bào)》介紹。
在此次比賽過程中,機(jī)器人暴露了仍存在動(dòng)態(tài)控制、感知不足等問題,也展現(xiàn)出較強(qiáng)的平衡控制、人機(jī)協(xié)同能力。
多名業(yè)內(nèi)人士對(duì)《科創(chuàng)板日?qǐng)?bào)》表示,從格斗過程來看,機(jī)器人底層算法已經(jīng)較為出色,但缺少真正的空間智能大模型作為機(jī)器人的大腦。為了更好地在實(shí)際應(yīng)用落地,后續(xù)產(chǎn)業(yè)鏈或?qū)⒂楷F(xiàn)更多二次開發(fā)的機(jī)器人解決方案商,在公版機(jī)器人基礎(chǔ)上開發(fā)專業(yè)的大腦。
《科創(chuàng)板日?qǐng)?bào)》注意到,在相互出拳、踢腿的格斗過程中,參賽機(jī)器人能通過步伐的調(diào)整來保持自身的平衡。在被擊中后,機(jī)器人也能迅速起身?!半m然格斗效果一般,摔倒爬起來的靈活性把我驚呆了,支撐力拉滿?!庇杏^眾表示。
“機(jī)器人倒地五秒內(nèi)馬上能起來,重心不穩(wěn)的情況下能調(diào)整身形維持平衡,這兩點(diǎn)讓我印象較為深刻。” 快思慢想研究院院長(zhǎng)、上海交通大學(xué)計(jì)算法學(xué)與AI倫理研究中心聯(lián)席主任田豐表示,“兩足機(jī)器人的動(dòng)態(tài)平衡性要比四足難得多。機(jī)器狗的重心只需要落在4個(gè)腳組成的矩形內(nèi)就行,支撐的面積大。而兩足人形機(jī)器人的重心需要落在兩足的連線內(nèi)?!?/p>
據(jù)悉,宇樹G1機(jī)器人在對(duì)抗中保持平衡,主要依賴于仿真環(huán)境的AI強(qiáng)化學(xué)習(xí)和本體關(guān)節(jié)的感知。通過對(duì)大量平衡數(shù)據(jù)的學(xué)習(xí)和模擬訓(xùn)練,機(jī)器人不斷優(yōu)化自身的平衡控制策略,同時(shí)本體關(guān)節(jié)的高精度傳感器能夠?qū)崟r(shí)感知身體各部位的姿態(tài)和受力情況,為平衡控制提供關(guān)鍵數(shù)據(jù)。
宇樹科技相關(guān)負(fù)責(zé)人向《科創(chuàng)板日?qǐng)?bào)》介紹,IMU(慣性測(cè)量單元)在機(jī)器人保持平衡中發(fā)揮著重要作用,在仿真訓(xùn)練中同樣不可或缺。IMU可以實(shí)時(shí)監(jiān)測(cè)機(jī)器人的姿態(tài)、加速度等信息。
值得一提的是,此次參賽的宇樹科技G1手臂進(jìn)行了定制化設(shè)計(jì),擁有7個(gè)自由度,比常規(guī)的5個(gè)自由度多出兩個(gè),目的是在格斗中進(jìn)行更靈活的招式變化,如勾拳、擺拳、上勾拳等拳擊動(dòng)作中的手腕調(diào)整,增加攻擊的角度和靈活性。
上述人員介紹,G1格斗模式的訓(xùn)練難度一是在于瞬間爆發(fā)力要求高,需要機(jī)器人具備強(qiáng)大的動(dòng)力系統(tǒng)來提供足夠的扭矩,以實(shí)現(xiàn)快速動(dòng)作響應(yīng)。二是對(duì)控制算法精準(zhǔn)度和穩(wěn)定性要求高,控制算法要實(shí)時(shí)處理大量傳感器數(shù)據(jù),精確計(jì)算身體各部位的運(yùn)動(dòng)軌跡與發(fā)力時(shí)機(jī),實(shí)現(xiàn)對(duì)多關(guān)節(jié)、重心、姿態(tài)毫秒級(jí)的精準(zhǔn)控制,保證動(dòng)作既有力又不失協(xié)調(diào)。三是機(jī)械結(jié)構(gòu)強(qiáng)度要求高,在進(jìn)行該動(dòng)作時(shí),機(jī)器人的機(jī)械結(jié)構(gòu)需要承受較大的沖擊力,對(duì)關(guān)節(jié)、骨骼等結(jié)構(gòu)的強(qiáng)度和穩(wěn)定性提出了很高的要求。
G1機(jī)器人操控方式包括AI語(yǔ)音操控、手柄操控、體感操控。各有優(yōu)缺點(diǎn)。而本次比賽中主要采用現(xiàn)場(chǎng)人員進(jìn)行手柄操作的方式。在比賽過程中,可以看到操作員在一旁控制機(jī)器人進(jìn)行格斗。
宇樹科技相關(guān)負(fù)責(zé)人對(duì)此解釋道,AI語(yǔ)音操控響應(yīng)延遲比較明顯,影響對(duì)機(jī)器人的實(shí)時(shí)控制。手柄操控讓參賽者更直觀、更精準(zhǔn)地操控機(jī)器人,也更易于上手,有利于擴(kuò)大參賽者范圍。而體感操控在沉浸感上更具潛力,宇樹已經(jīng)開發(fā)了一套體感人形機(jī)器人控制系統(tǒng),后續(xù)的比賽應(yīng)該就可以給參賽者使用。
中國(guó)信通院泰爾系統(tǒng)實(shí)驗(yàn)室副總工程師劉泰介紹,對(duì)機(jī)器人進(jìn)行手柄操控,與日常普通的遙控玩具,存在一定的區(qū)別。人形機(jī)器人其背后是一整套的大模型、運(yùn)動(dòng)控制模型的算法支撐,實(shí)際上是在通過這些算法來進(jìn)行操控。
“采用傳統(tǒng)的控制方法很難讓它站得住走得穩(wěn),現(xiàn)在通過強(qiáng)化學(xué)習(xí)的訓(xùn)練方式,讓它往能夠站得平衡的方式由自己去探索。整體的比賽非常振奮,它的表現(xiàn)可以說比以往更進(jìn)了一步,能夠看到機(jī)器人在對(duì)抗比較強(qiáng)的情況下,也能夠保持很好的穩(wěn)定性,包括全身的運(yùn)動(dòng)機(jī)構(gòu)協(xié)調(diào),是科技進(jìn)步和產(chǎn)業(yè)進(jìn)步很好的結(jié)合。” 劉泰提到。
田豐認(rèn)為,“在暫時(shí)還不能實(shí)現(xiàn)通用人工智能AGI的前提下,能否通過人機(jī)協(xié)同來達(dá)到比較好的效果,是當(dāng)前業(yè)內(nèi)探索的方向。而這場(chǎng)比賽也展現(xiàn)了一定的成果,這也是很有價(jià)值的。”
不過,由人類遙控操作的機(jī)器人也存在比賽失誤的情況。比如選擇主動(dòng)攻擊對(duì)手,不當(dāng)心撲空后,導(dǎo)致參賽機(jī)器人失去穩(wěn)定九游體育官網(wǎng)性倒地,被對(duì)手“KO”。機(jī)器人想要后退來調(diào)整對(duì)戰(zhàn)角度,卻意外被擂臺(tái)的圍繩給纏住,需要人類來解綁等等。這其實(shí)暴露了機(jī)器人動(dòng)態(tài)運(yùn)動(dòng)控制與實(shí)時(shí)感知的不足。
“這就涉及到一個(gè)問題,機(jī)器人是否要完成仿真人類的形態(tài)。比如人背后沒有長(zhǎng)眼睛,但機(jī)器人后背是否應(yīng)該設(shè)置攝像頭,讓機(jī)器人擴(kuò)大感知范圍。再比如人只有5個(gè)手指,但有些工業(yè)場(chǎng)景可能6個(gè)手指會(huì)更好。人形機(jī)器人可能只是一個(gè)過渡階段,未來可能會(huì)發(fā)展出超越人形的機(jī)器人形態(tài)。” 田豐表示。
一名觀賽的業(yè)內(nèi)人士認(rèn)為,從格斗過程來看,底層算法已經(jīng)較為出色,包括穩(wěn)定性、視覺、靈活性、速度連貫性等,目前缺少的是真正的空間智能大模型作為機(jī)器人的大腦。
田豐表示,從中美來看,在機(jī)器人大腦的投入是美國(guó)的比例更大些。“國(guó)內(nèi)企業(yè)大部分都在做機(jī)器人本體,有一些機(jī)器人企業(yè)在做小腦,也就是運(yùn)動(dòng)控制系統(tǒng)。做機(jī)器人大腦的企業(yè)大概在1/20的比例。不過,已經(jīng)有一些機(jī)器人企業(yè)正在進(jìn)行大腦研發(fā)?!?/p>
從產(chǎn)業(yè)鏈來看,田豐認(rèn)為業(yè)內(nèi)更多的關(guān)注焦點(diǎn)在于整機(jī)廠商,以及電機(jī)等硬件層面,而大腦也是通用型的基礎(chǔ)性大腦?!暗珯C(jī)器人整機(jī)其實(shí)需要軟件二次開發(fā),才能更好地在實(shí)際應(yīng)用。比如面向格斗、工廠、物流等場(chǎng)景進(jìn)行二次開發(fā)。后續(xù)產(chǎn)業(yè)鏈會(huì)涌現(xiàn)這類的機(jī)器人解決方案商,在公版機(jī)器人基礎(chǔ)上開發(fā)專業(yè)的大腦。這就涉及到多模態(tài)大模型,以及RAG知識(shí)庫(kù)進(jìn)行融合?!?/p>