天天看點

浙大研究登頂刊封面:微型空中機器人叢集像飛鳥自由穿過密林

10餘架手掌大小、單機重量小于一聽可樂的微型空中機器人,在浙江安吉的一片竹林中騰空而起,在沒有GPS、動作捕捉系統、遠端通信運算或是預先建立環境地圖的情況下,各自獨立又協作地穿過低矮的灌木、傾斜的竹竿、起伏的地面、稠密的樹枝,如同一支協同卻又自主的鳥群。

這是浙江大學控制科學與工程學院高飛、許超團隊對全自主微型空中機器人的最新研究成果之一。團隊研發的微型且完全自主的空中機器人,能夠在高度混亂的野外環境中,根據機載傳感器提供的有限資訊實作叢集飛行。機器人上的軌迹規劃算法能夠自主規劃飛行路線,同時滿足飛行效率、避障、機器人間互相避碰、動力學可行性、叢集協調等多種要求。

當地時間5月4日,以上成果以《野外微型飛行機器人叢集》(Swarm of micro flying robots in the wild)為題,并作為封面文章發表在機器人領域的國際頂刊《科學·機器人》(SCIENCE ROBOTICS)上。論文第一作者為浙大控制學院在讀博士生周鑫,通訊作者為高飛博士和許超教授。

在接受澎湃新聞(www.thepaper.cn)記者采訪時,浙大控制學院博導高飛表示,這一成果将為未來微型空中機器人叢集以及相關算法應用在戶外救災、野外生物研究、協作運輸等領域奠定基礎。

作為未來技術的象征,空中多機器人系統的靈活性已經在諸多科幻電影中有所呈現。在《普羅米修斯》中,宇航員在決定走哪條路之前,釋放了幾個微型飛行裝置來探索一艘未知的外星飛船。在《安德的遊戲》中,空中機器人叢集系統包圍了宇宙飛船,形成了一個抵禦外星人攻擊的盾牌,為人類掃清了一條赢得戰鬥的道路。在《星球大戰前傳3》和《銀翼殺手2049》中,摩天大樓之間的空中交通在高科技星球上繁忙而有序的運作。

随着處理器計算能力、感覺和通信方面的發展,諸如四旋翼飛行器之類的空中機器人已經進入大衆生活,這些飛行器不但具有高機動性,而且價格低廉。據《日本經濟新聞》報道,DJI的Mavic Air 2是目前最暢銷的空中機器人之一,它擁有避障、跟蹤等功能,并且具有10公裡的通信距離,其硬體成本僅約135美元。此外,空中機器人市場仍有大量的可能性,到2028年,空中機器人整體市場價值預計将達到5000億美元。

不過,盡管空中機器人自主導航在工業和學術實踐中都得到了快速的發展,但高度混亂的環境,如茂密的森林,仍然是空中機器人難以進入且自由穿梭的,更不用說成群的空中機器人。在這些場景中,未知的複雜環境和狹窄的可行空間會對空中機器人叢集協調帶來極大的挑戰。

“在空中機器人的研究中,從單一機器人轉向協同的叢集系統,也是機器人智能發展的必然趨勢。”高飛向澎湃新聞記者介紹說。空中機器人是高飛在香港科技大學攻讀博士學位時的主要研究領域,當時其研究方向主要為空中機器人單機導航。2019年底,高飛到浙江大學任職并開始帶領團隊開展空中機器人自主導航及叢集技術研究,團隊為此次野外空中機器人叢集論文準備了約兩年時間。

據了解,在混亂的野外環境下空中機器人叢集導航之是以困難,是因為野外環境對空中機器人叢集提出了四方面的要求,簡稱TEEM——軌迹最優性(trajectory optimality), 可擴充性(extensibility,)、低成本計算需求(economical computing)和小型化(miniature size)。

軌迹最優性反映了任務品質和飛行時間,這種效率在緊急的救援情況下至關重要。軌迹最優性要求面對各種複雜環境,都能夠允許空中機器人快速、安全、穩定的飛行和穿越,這種性能在緊急救援情況和混亂狹窄環境中至關重要。

可擴充性指的是空中機器人對不同任務的需求在軟體硬體上的拓展能力,如針對多機協同目标跟蹤任務,既需要在軟體上增加識别功能又需要在硬體上拓展多方位鏡頭。

低計算成本需求非常重要,這允許了空中機器人攜帶更小的機載處理器,并且減少對變化環境和突發情況的反應時間,進而為其他使用者定義的任務(如目标檢測和決策)預留盡可能多的可用計算資源。

最後,所有這些能力應該放在最小的飛行器中,因為重量和體積直接關系到機器人的續航能力和對狹窄空間的穿越能力。

然而,這四個方面的要求卻是互相沖突的,想要同時實作需要精确的權衡。例如,更高的軌迹最優性要求複雜的模組化和求解空間中的更多疊代求解次數,這會極大的增加計算時間和計算成本。更高的可擴充性要求以更一般化的形式定義問題和任務,但要犧牲潛在的對特定任務的優化。

“對于空中機器人叢集來說,滿足安全性、動力學可行性、最小化時間以及最大化軌迹平滑度已經是一項巨大的挑戰,同時在微型平台上實作更是難上加難。這就是為什麼以前的研究無法從結構化的、人為的環境走向不确定性的野外環境。”論文中說。

在現實世界中,Intel、High Great和CollMot已經展示了令人印象深刻的空中機器人編隊表演。然而,在大規模和成功的商業用途背後,使用全球導航衛星系統定位的空中機器人編隊僅僅遵循預先設定的軌迹,無法在有障礙的野外地點操作。

為了解決這一問題,機器人研究者們試圖從大自然中找到靈感,即觀察大自然如何應對這種導航挑戰。在自然界,昆蟲執行短期反應,而鳥類喜歡相對長期的平穩動作。這是因為鳥類比昆蟲有着更敏銳的視覺和運動感覺、自由度更高的運動系統、以及更大的大腦容量。

昆蟲與鳥類這兩大飛行物種也啟發了兩種主流空中機器人導航方法:基于昆蟲反應的和基于鳥類軌迹的規劃方法。在這兩種方法中,前一種在計算和記憶體方面包含了極其輕量級和高效的解決方案,允許更輕量化的空中機器人叢集;而後者顯示了更高的優化性和靈活性。為了提高任務效率和可擴充性,高飛的團隊選擇了後者。

在研究各種空中機器人叢集應用後,團隊發現解決“TEEM”難題的關鍵是機器人軌迹時空規劃,即不僅僅是能夠改變軌迹形狀,還需要調整時間分布,以最大限度地利用空間。如果僅進行空間變形,空中機器人在通過狹窄通道時,往往會繞行等待其它機器人,這将阻礙後續空中機器人的飛行,導緻飛行軌迹較差甚至不安全。是以,同時規劃飛行軌迹的形狀和時間,也稱為時空軌迹規劃,是空中機器人安全高效飛行的關鍵。盡管如此,這種聯合優化對于多旋翼飛行器來說是一個巨大挑戰,因為共同确定軌迹的空間和時間參數是高度耦合的。

“實作聯合時空軌迹規劃,保證機器人叢集中每一個機器人都能實作軌迹的時空最優。這無疑是研究中最為困難的。”高飛說。

團隊在其提出的方法中,通過解耦目标函數計算中的時空參數,實作了優化變量與表示軌迹的中間變量之間的線性複雜度映射,進而實作了時空優化。是以,即使在最受限的環境中,空中機器人也可以在短短幾毫秒内獲得高品質的軌迹。

特别地,在團隊的空中機器人叢集中,每架空中機器人都具有完整的感覺、定位、規劃和控制功能,并通過廣播網絡共享軌迹進而實作群體協同。這類似于鳥類能夠在森林中自由飛行,同時避開障礙物和其他移動的生物。例如,在近程導航中,鳥類主要依靠眼睛和前庭系統,相應地,團隊開發了改進的視覺慣性裡程計(visual-inertial odometry)。此外,鳥類可以同時調整路徑和速度以避免碰撞,同時考慮飛行時間和平滑度以節省能量,是以團隊提出了多目标時空軌迹聯合優化方法。除了具備小型鳥類的能力,團隊還進一步利用了機器人這一人工電子系統的優勢,将高保真無線通信用于運動軌迹共享,将高速計算用于快速規劃。此外,團隊的解決方案滿足了個體智能和群體智能的分布式協調,提高了系統的魯棒性。

目前,團隊在論文中已經釋出了空中機器人叢集研究的前沿算法軟體,“開發人員可以部署和使用這些軟體,從仿真環境中驗證他們的算法,在未來,這些算法能夠應用在物流小車、機器人配送、野外搜救等領域和環境。”高飛說。

值得一提的是,在論文中,團隊通過在真實世界的實驗,重點展示了四個具有挑戰性的應用。而就在論文發表的當天,高飛團隊在國内知名視訊網站哔哩哔哩上釋出了這四個實驗場景的視訊,截止本文撰寫時,已獲得5.6萬的播放量。

飛越茂密的森林

Challenging wild navigation with bamboos and various other obstacles.

本實驗旨在展示在高度密集的野生環境,即竹林中,空中機器人叢集實作完全自主的群體導航,而不會傷害到機器人本體或植物。圖像中呈現的軌迹顯示了軌迹規劃的顯著優勢:所規劃的軌迹總是直接而平穩地連接配接一個一個間隙。

在這些環境中,除了垂直生長的竹子外,還有傾斜的竹子、樹幹、低矮的灌木叢、雜草叢生的溝渠、不平的地面、被風吹起的樹葉等障礙物,需要系統對軌迹進行三維規劃。這種由形狀不規則、分布密集的障礙物組成的非結構化環境,驗證了空中機器人叢集在大多數混亂的地方(比如災難場景)導航的能力。

野外的編隊導航

Swarm navigation in formation with prior-unknown obstacles.

該實驗證明了所提出的統一軌迹規劃的可擴充性。在這裡,編隊被定義為保持一個期望的移動形狀,這意味着空中機器人以固定的相對位置移動。與此同時,每架空中機器人還能獨立導航,避開障礙物。本實驗相對于“竹林穿梭”實驗,障礙物密度有所降低,以使編隊清晰可辨,但仍有灌木叢、高低錯落的樹木和兩根人造鐵柱。

按照規劃的軌迹,空中機器人叢集以固定隊形在樹林中飛行。從變形曲線和速度曲線可以看出,盡管空中機器人有時必須偏離路線以避開事先未知的障礙物,但此後會再加快速度以趕上編隊,進而群集仍保持編隊。當空中機器人避開樹木時,平均速度會自動下降,當它們完全回到開放空間時,平均速度會增加。在這種情況下,一些個體的速度變化,在沒有顯式預程式設計的情況下也能傳播到整個編隊。這一結果顯示了安全與飛行時間之間的隐性平衡,在障礙物附近減速保留了對潛在碰撞的更多反應時間,而盡可能加速則減少了空曠區域飛行時間。

密集互相避障評估

Evaluation of intensive reciprocal collision avoidance with unexpected events

這一實驗的設定模拟了摩天大樓之間密集空中交通的最基本要求:安全、高效和獨立導航。為了驗證10架空中機器人的這一能力,試驗者在一個半徑為3米的圓上,将目标位置随機配置設定給空中機器人。為了更好地模拟真實的飛行情況, 飛行區域中除了有茂密的樹幹和錄影機的三腳架,還用長方體和圓柱形障礙物模拟建立建築,空中機器人叢集也需要穿過該地區大型移動障礙物。接下來,實驗者關閉所有地面定位标簽(僅在本實驗中使用),以模拟全球定位的暫時性丢失。

由于安全性和效率是運輸系統的兩個主要關注點,研究者評估了最小碰撞距離和3分鐘飛行中完成傳遞的總數量(達到目标總數),在整個飛行過程中,研究者将每架空中機器人模組化為一個半徑為7cm的球體。單架空中機器人設法與障礙物和其他機器人保持安全距離。實驗顯示,到達目标的數量随時間的增加而線性增加。實驗結果表示,在不同障礙物密度下,由于規劃的軌迹是局部最優的,是以可以獲得接近恒定的增長速率。

目标遮擋情況下的空中機器人叢集

Multidrone tracking with target occlusion.

這個實驗展示了在微型平台上添加高計算負荷硬體、以及運作額外任務需求的潛力。叢集跟蹤可以用于多視圖航拍和視訊,可以對參與者進行全面的記錄,為後期編輯提供更多的素材。在實驗中,焦點是一個在樹林中移動的人類參與者。為了在避開障礙物和其他空中機器人的同時追蹤目标,實驗設計了跟蹤的限制懲罰來規劃所需的軌迹。從結果可以看出,被追蹤人員可以在不需要擔心空中機器人碰撞或跟丢的情況下向前移動。

繼續閱讀