每個機(jī)器人的形態(tài)、大小、樣貌都不一樣,這需要根據(jù)具體的應(yīng)用場景進(jìn)行分析和設(shè)計。但是無論是哪種形態(tài)的機(jī)器人,基本上都會嵌入視覺系統(tǒng),用于感知周圍的環(huán)境,然后通過反饋的信息規(guī)劃機(jī)器人的動作。
香港中文大學(xué)天石機(jī)器人研究所所長劉云輝教授自本科起就從事機(jī)器人研究,至今已經(jīng)有數(shù)十年的研發(fā)經(jīng)驗。在 ACT Lab 和深圳灣聯(lián)合舉辦的“機(jī)器人控制系統(tǒng)和視覺的融合”活動中,劉云輝教授向慕名而來的創(chuàng)業(yè)者們分享了自己在機(jī)器人領(lǐng)域的所思所得。
我灣梳理了本次演講的重點和要點,帶領(lǐng)讀者了解機(jī)器視覺領(lǐng)域最前沿的研究課題。
三維視覺技術(shù)大有可為
實時三維視覺技術(shù)應(yīng)用廣泛,在機(jī)器控制、物件抓取和人機(jī)交互等技術(shù)領(lǐng)域,都不能脫離實時三維視覺技術(shù)。正因如此,該技術(shù)有著巨大的商業(yè)潛力。據(jù)報道,預(yù)計 2020 年,全球 3D 成像系統(tǒng)市場預(yù)計能達(dá)到 536 億人民幣,年度復(fù)合增長率 39.4%,尤其是在體育醫(yī)學(xué)、矯形外科學(xué)、人體測量等醫(yī)學(xué)領(lǐng)域,對 3D 成像技術(shù)的需求更為強(qiáng)烈。
劉云輝教授研究實時三維視覺技術(shù)多年,他認(rèn)為:“研究三維視覺技術(shù),歸根結(jié)底,就是要理解什么是視覺信息,然后將這些視覺信息在實際的場景中應(yīng)用起來。”他研發(fā)的基于結(jié)構(gòu)光的雙目視覺技術(shù)具有精度高、測量速度快、動態(tài)拍攝等特點,并且已經(jīng)應(yīng)用在商業(yè)化的 3D 成像系統(tǒng)中。
工廠叉車也要自動駕駛
目前,大型工廠的室內(nèi)物件搬運 70% 靠的是人工駕駛叉車進(jìn)行操作,但從事重體力勞動工人的人工成本上升和人力資源的短缺,對很多行業(yè)造成重大影響,移動機(jī)械的自動化改造需求迫切。
經(jīng)研究發(fā)現(xiàn),室內(nèi)移動器械自動駕駛的挑戰(zhàn)主要有兩點:一是無 GPS 的定位和制圖,二是精確的運動控制。憑借多年的圖像傳感器研發(fā)經(jīng)驗,劉云輝教授將 Visual SLAM 算法和 RGB-D 傳感器集成到移動機(jī)器人的視覺導(dǎo)航模塊上,應(yīng)用于移動機(jī)械平臺,實現(xiàn)了低速且高精度的自動駕駛功能。
劉教授表示,目前為了保證安全性,移動器械的速度并沒有做得太快。不過,制造業(yè)、建筑業(yè)、采礦業(yè)、物流業(yè)等領(lǐng)域?qū)κ覂?nèi)移動器械自動駕駛有強(qiáng)烈的需求,所以,該項技術(shù)在未來會有很大的發(fā)展空間。
“軟”“硬”兩手抓
機(jī)器人或者機(jī)械臂所抓取的物件基本上都是剛體,很少能對變形體進(jìn)行抓取。不過,在日常生活中,很多物件并不是棱角分明并且內(nèi)部結(jié)構(gòu)堅硬的剛體,而是以柔性體的形式存在,比如日常所穿的衣服、吃的食物、線材、柔性 PCB 以及人體組織。
劉云輝教授認(rèn)為,在需要操作形變體的領(lǐng)域中,醫(yī)療健康對該技術(shù)的需求最強(qiáng)烈并且對操作的精準(zhǔn)度也更高。劉教授結(jié)合自身的研發(fā)經(jīng)驗補(bǔ)充說:“醫(yī)療手術(shù)機(jī)器人的研發(fā)主要有三個挑戰(zhàn):首先是安全性,醫(yī)療手術(shù)中不能容許半點差錯,所以如何保證手術(shù)機(jī)器人的安全性,以及與操作醫(yī)師的有效配合是重中之重;保證安全性后,機(jī)器人如何在柔軟的體內(nèi)進(jìn)行解剖和組織切除,機(jī)械結(jié)構(gòu)如何設(shè)計,視覺系統(tǒng)如何設(shè)計,就是研究人員面臨的第二大挑戰(zhàn);第三,如何讓不懂機(jī)器人技術(shù)的醫(yī)生快速上手操作,人機(jī)交互如何設(shè)計,則是第三個挑戰(zhàn)。”
為了應(yīng)對這三大挑戰(zhàn),劉教授針對性地提出了三個解決方案:首先,手術(shù)機(jī)器人可采用小尺寸的、彈性的、或者柔性的機(jī)械結(jié)構(gòu),在保證操作精度的同時防止人體組織被機(jī)械所傷;第二,在機(jī)器人內(nèi)部嵌入多種傳感器,比如 IMU、聲音傳感器、體感設(shè)備、眼球跟蹤設(shè)備等,增強(qiáng)機(jī)器人的功能,并簡化操作方式;第三,通過在機(jī)器人中內(nèi)嵌攝像頭,以圖像引導(dǎo)的方式實時獲取手術(shù)反饋。
人形才是最適的人機(jī)交互方式
我們周圍的生活環(huán)境是以人類的行為方式為基準(zhǔn)而建立的,人類可以相當(dāng)輕松地上樓梯、開門、適應(yīng)各種地形,所以說最好的機(jī)器人形態(tài)就是人形機(jī)器人。同理,人和人的溝通是我們最習(xí)慣的交互方式,所以最好的人機(jī)交互就是機(jī)器人以“人”的方式進(jìn)行交互。
人類的語言以及表情能夠傳遞大量的情感信息,所以目前仿人形機(jī)器人的研究主要集中在機(jī)器人的語言以及表情模擬這兩個領(lǐng)域。但是,除了語言和表情,肢體動作也能夠傳遞人的情感信息。
劉云輝教授認(rèn)為,相對于語言和表情,讓機(jī)器人模擬人的動作在技術(shù)上更容易實