天天看點

陳士凱:讓機器人完成自主定位導航到底有多難? | CCF-GAIR 2017

雷鋒網(公衆号:雷鋒網)按:2017 年 7 月 8 日,由

ccf 中國計算機學會主辦,雷鋒網與香港中文大學(深圳)承辦的全球人工智能與機器人峰會 ccf-gair 大會進入第二天。在機器人專場,思岚科技

ceo 陳士凱帶來了以《自主定位導航技術的現狀和未來應用趨勢》為題的主題演講。以下是陳士凱演講全文,由雷鋒網整理。

陳士凱:讓機器人完成自主定位導航到底有多難? | CCF-GAIR 2017

雷鋒網注:思岚科技ceo陳士凱

最近一兩年,可能“slam”這個單詞已經被很多人認識。

slam 也是我們公司名字(思岚)的音譯,叫同步定位與建圖,能同時進行自主定位和地圖構圖。不過它本質上并不是簡簡單單完成定位和導航,slam 在模型上可以保證機器人在完成定位和建圖之間沒有誤差。

換句話說,slam 和解決機器人的自主定位導航還有比較大的差距,這個差距就在于還要做另外兩件事情——路徑規劃和運動控制。

路徑規劃,耳熟能詳的是 a star 的算法,很多行業都在用,包括即時戰略遊戲。機器人在目前實際産品中,都會以 a star 為主。

除了 a star 以外還有随機探測速的方式,是随機的路徑探索。這種方式的好處是在一定的機率情況下,可以比 a star 更高效的探索空間。但這兩種方式隻是解決巡路問題,要自主行走還要控制行為,防止機器人繞行,或躲避障礙物。

現在機器人的避障,叫動态視窗化。它更加像人一樣,會在每時每刻判斷機器人下一時刻可以展開的行動,避開具體的障礙物。除此以外,導航這件事并不是前面看到的從a點到b點這麼簡單。

另一個應用的點就是掃地機器人中用到的算法,coverage problem。它是盡可能讓機器人覆寫到所有區域,而路徑規劃或者 a 點到 b 點的行動是讓機器人盡可能到達目的地,這代表不同的行為方式。

在實際使用當中,還會有一些看上去比較次要,但應用中又非常關鍵的技術。比如這裡看到的自主充電對接過程,這些過程也和前面說的路徑規劃算法有一定的并列性。

目前為止,以國内的情況看,服務機器人的應用分兩類。

第一類,家裡都會買到的掃地機器人,以及家庭看護、陪伴型機器人。這類的應用場景,一句話概括,零配置。對于消費者使用來說,要做到盡可能極簡,買回來就能使用。第二類,在商業場景下,講究的是一個預先配置過程,并且對于這種方案,講究的是高的可靠性和可擴充性。

家庭場景需要解決的問題

個人家庭場景導航定位系統要解決的是三方面的問題——功耗、體積、成本。對于消費級别的産品,更關注的是怎麼樣把同樣的功能以更低的代價,這裡指的是價格或者開發周期或者使用難易度,變成一個具體的産品。

思岚科技曾經做過一些努力。比如成本問題上,現在低成本雷射雷達已經可以一部分解決導航定位使用成本的問題。

除了成本問題以外,還有很多其他亟待解決的問題。

在機器人實際産業化之前,研究機構的機器,都擺脫不了一個共同的特點:他們頭上都裝了一個筆記本電腦或者一個工控主機。這裡要解決就是功耗問題。

我們知道目前無論 slam 的算法還是路徑規劃系統,複雜度都比較高。拿現在主流的筆記本電腦跑都有點吃力。目前 slam 裡面的凸優化算法都不可能線上進行運作,必須靠離線式進行運算。把技術使用到實際産品中的時候就會遇到問題。

比如我們這裡給出的是上百瓦的級别,但是一個掃地機器人,電池本身的容量可能隻有20多瓦時的規模。意思是我現在如果讓掃地機器人上裝一個筆記本跑 slam 算法,可能一個小時不到就沒有電了,這是完全不被接受的。

思岚科技的解決方式是通過高度算法優化和內建,把導航定位系統的體積和運算性能負荷上做到最小。現在在硬币大的

slam ware 裡面可以實作傳統資訊機和開源算法,在功耗情況下,我們可以在 2 瓦下完成 slam

規劃所有事情,同時體積和發熱情況都可以有很大的改善。

我們做了一些案例。比如現在最新釋出的一個開源參考平台,基于雷射雷達和導航定位系統的。這是目前能實作的最小具有雷射自主定位導航的機器人,它的特點是隻需要幹電池就可以供電,并且實作兩個小時以上的待機時間。前面功耗的問題就可以達到很大的解決,實際産品中,現在不會讓使用者使用幹電池,很多使用者會使用可充電式的锂離子電池,讓機器人可以實作

8 小時以上的待機時間。

另一方面,在實際使用場景下,前面說過機器人在家庭情況下要以零配置的使用。對于導航定位問題來說,機器人開機以後對家裡的環境構造是完全不知道的,而前面提到的路徑規劃算法都有一個共同的要求,需要把地圖預先繪制出來。

這時候是一個沖突點,我既希望這個機器人在環境位置的時候展開工作,但一些主流算法還是需要對于地圖或者環境有一個預先的建構或者預先的探索,才可以展開一些算法。這裡面産業界就需要做一些額外的工作,這是現在

slam ware 系統裡支援的路徑規劃系統,可以在地圖甚至完全未知和部分未知就可以展開行動。

這和玩《星際争霸》一樣,可以給一個初級的路徑規劃,随着機器人探索,路徑可以逐漸進行細化。這個過程在很大程度上可以幫助機器人。除了這個比較基礎的功能以外,還需要很快很多的算法進行配合,比如自主環境探索和地圖建構,這是目前帶有導航定位掃地機器人的标配。因為對于未知環境,必須先把環境進行探索,框定清掃區域。

消費級别機器人還有一個非計算的問題,是心理學上的問題,就是地圖怎麼呈現。目前使用任何新的技術都會帶來成本上升,成本的上升往往伴随着功能溢價,是以廠家必須把新的功能提升到讓使用者有感覺。

如果機器人具備了雷射導航和地圖建構能力,在使用當中,都會非常希望讓使用者看到機器人真正的繪制地圖。這時候就有一個心理上的問題。一張圖是一個人認為機器人繪制的地圖效果,但實際上很多時候

slam

系統給出的地圖雖然不算差,但也稱不上很好。如果我展現的是這樣的地圖,那在使用者心理上就會産生很大的障礙。他會覺得這個産品看上去是不是不值這個價格。

在實作導航定位系統的時候,也會關注另外一件事情,這件事情機器人不會考慮,但是對于人來說比較注重,對于構圖的精細程度。這是目前思岚在嘗試努力的方向。

商用場景下或者專業場景下,對于導航定位的應用方式跟消費者完全不一樣。機器人在一個商場或者商家真正開始展開行動之前,會有一個預部署行為,這一般是由廠家或者代理商、內建商來幫助客戶進行部署,地圖在這時候完全建構,并且有很大的機會對地圖進行修改。

一般是兩種内容,設定poi。我們繪制的地圖和業務邏輯,到目前為止還沒有完全,比如我繪制一張平面圖,機器人可能并不知道平面圖中的某一個位置指的是一個餐桌或者入口,還是需要人進行标注,叫poi的标注。

雖然機器人擁有定位導航的能力,但實際使用時,使用者心理上還是有不安全感。這時候在地圖上進行額外的标注設定區域。

完成這件事情以後就是日常營運,這就比較簡單。這時候地圖已經已知,更多使用預定的定位導航算法和商家開發的業務邏輯進行使用。這時候還會有後續日常維護,比如環境發生大的變化,發生重新裝修,就需要對地圖進行重新建構或者标注。

針對商用場景,對于導航系統會有點困難。

第一,商用場景下地圖面積都很大,家庭場景一兩百平甚至兩三百平已經足夠。如果一個家裡動辄幾千平,那肯定是一個土豪,我們就應該賣一個商用版本的。

但是商用情況下,這樣一個環境,在今天gair現場,地圖會超過上萬平米。這時候對于導航定位系統來說,就會有很大的挑戰。因為目前來說,這個slam系統還是比較消耗記憶體和運算量。怎麼樣讓它在十萬多平的場景下都可以進行工作,這是很大的挑戰。

解決方法,首先是配備比較強大的硬體,同時對于軟體和算法進行更強大的優化。另外,對于雷射導航定位來說,大的環境是需要有更加遠距離的雷射雷達。我們目前的做法是現在

rplidar 可以實作更遠距離,從工業版本的 16 米到今年釋出的 t 系列 100

米測量距離,可以涵蓋商業和工業場景下的使用。同時在成本上也會保持很高的領先優勢。

除了大地圖的問題,全局定位是我們認為目前在商用情況下都普遍要嘗試解決的問題。目前在行業中有兩種解決思路。第一,借助傳統定位方式,比如 uwb,目前有很多商用機器人在這個環境中布置 uwb 的信标或者 wifi 甚至室外有 gps 完成定位。但這兩年的技術,單獨靠雷射導航定位系統本身就可以完成一定全局定位的能力。

這是一個商用機器人的案例。它在一開始可以不需要讓這個機器人進行位置初始化,給它幾秒鐘時間,機器人就可以自動恢複到地圖上的坐标。這個技術在學術界很早以前就已經展開使用。但部署到實際産品中,會發現它直接使用算法就會出現這樣那樣的問題。

多傳感器融合也是我經常聽到的質疑。行業單線雷射雷達隻能檢測一個平面,無人駕駛裡,為了解決這個問題,會采用三維雷射雷達,但是對應的問題是帶來成本和量産問題。

在機器人行業中,要解決雷射雷達的問題,可以用一個很簡單的手段,融入更多傳感器。比如超音波、視覺傳感器。這裡展現的是機器人在一個沙龍中進行送餐的畫面。單單靠雷射雷達,是不可能感覺到人的接近并且停下來的,就需要用到多傳感器融合技術。

目前一個合格的導航定位系統,我們認為它所應該輸入的傳感器信号不應該僅僅是一個雷射雷達,同時應該有視覺的傳感器和超音波。在導航定位算法上也要進行對應的融合。這個融合,在學術上或者算法上并不是一個非常難的事情,但是要考慮很多工業化的問題。比如像超音波的傳感器,很多時候是非标的産品,對于深度視覺傳感器安裝位置有很大差別,每一家規格也不一樣,怎麼樣以統一标準化的接口友善客戶進行使用,就存在一定挑戰。

開發便利性是我們認為除了成本形态以外,另外一個制約機器人導航定位技術應用的問題。我們的思路是機器人這個産業,并不是一個簡簡單單通過硬體和機械解決的,更多可以通過軟體。通過軟體的額外輔助和算法,可以讓這些機器人具有更多的功能。

比如前面提到的 poi 能力,在開發調試中可能用到的多圖層地圖支援,這些開發調試需求,怎麼樣在實際應用過程中幫到使用開發者。這裡面是一些具體的方式,比如對于地圖的标注,現在支援兩種通過軟體輔助的方式,一種叫虛拟牆,還有一個叫虛拟軌道。

多圖層和poi,這個過程在軟體算法内部會采用一些經典的算法,比如蒙特·卡羅算法,使用多圖層就可以在遠端觀測到工作情況。poi 是軟體方式,可以自動把一個現有的 slam 地圖通過軟體标準進行 poi 的裝置。

最後講一下未來導航定位系統的發展趨勢。

對于 v slam 和 lidar slam 誰更重要的問題,實際上是一個融合的過程。這兩種技術都有優缺點,雷射的缺點毋庸置疑,傳統雷射雷達很貴,第二很多方面不大靈活,目前為止,傳感器還不成熟。對環境光影的變化或者室内比較昏暗的場景,v

slam技術都沒辦法使用,但如果把這兩種 slam 技術融合在一起,并且配以目前低成本的傳感器,這種融合式的 slam

方式會是未來比較重要的趨勢。

提取語義資訊,也是配合視覺雷射做的。目前繪制的地圖還比較平級,通過采集圖象資料和深度學習,可以主動在地圖上進行标記,就可以避開前面提到的人工 poi 标注過程。

前行業中還有一個趨勢——深度學習。這一兩年,深度學習成為人工智能的代名詞。在這個行業,前幾年還是以比較傳統的機率學,或者控制論的方式進行機器人自主定位導航。但這裡展現的是完全通過深度學習,直接通過攝像頭資料作為信号輸入,再通過神經網絡直接産生出機器人的控制信号。其中像

slam 的過程、路徑規劃的過程,完全通過學習的方式就可以進行實作。

我認為這種技術可能會成為未來的一種潮流,但是不是在有限的将來,在實際産品中進行展現,還是需要給予時日。但不變的是,在行業中取長補短,結合不同新的技術進行融合,這是不會改變的事實。

本文作者:六爺

繼續閱讀