天天看點

發展型機器人:由人類嬰兒啟發的機器人. 2.5 嬰兒機器人模拟器

<b>2.5  嬰兒機器人模拟器</b>

機器人平台往往是昂貴的研究工具,通常世界上隻有很少的實驗室能夠負擔得起。裝置齊全的icub的成本在2012年大約是250000歐元,是以隻能通過參與大規模的研究資助才能承擔得起這些費用。asimo和qrio等其他機器人平台還沒有商業化,如果可以購買的話,其成本将超過100萬美元。更便宜的機器人,比如nao機器人,其成本大約6000美元,盡管一些中等規模的實驗室和研究基金支付得起,但還是需要對實驗室裝置進行重大投資。此外,機器人實驗室的配置和運作成本隻有少數研究人員和實驗室能夠負擔得起。這就是好的、真實的現有機器人平台仿真軟體模拟器對發展型機器人研究極其有用的原因之一。60

當然,鑒于機器人模拟器隻能提供對有限的機器人機械結構實體性質的現實模拟,是以機器人模拟器不能完全替代真正的機器人實驗(這還沒有考慮如何以一種可靠且有用的方式來模拟更複雜的外部世界)。這種不完全的替代性對從模拟結果轉換到現實機器人有着重要的意義。然而,為什麼機器人軟體模拟器更适用于一般認知模組化與認知機器人研究?這個問題有着許多科學上的根本原因(tikhanoff、cangelosi和metta 2011;ziemke 2003;cangelosi 2010)。這些原因包括:①對原型機器人的測試;②形态變換實驗;③多智能體和進化機器人研究的應用;④合作研究。

使用模拟器的第一個優勢是原型機器人的測試,尤其是在新平台設計的早期階段。一些進階的實體模拟器工具,如免費使用的開放動力學系統(open dynamics system,ode.org),它能夠真實地呈現剛性身體機器人模拟器的物體互動動力學。這就可以使設計師在實際生産之前,對模拟不同配置的傳感器和執行器進行測試。第二個優勢是,軟體仿真的虛拟機器人在設想的形态配置設計階段不需要開發出對應的硬體結構。比如,形态進化實驗就是這樣一個例子(kumar和bentley 2003;bongard和pfeifer 2003),機器人控制器與身體和外部世界互動的模型裡是不需要有實際硬體結構的。在發展型機器人研究中,模拟器可以實作與身體形态相關的成熟現象的調查研究,如成長過程中的機器人肢體長度和全身尺寸之間比率的改變,進而對已知兒童形态學變化進行模組化。使用機器人仿真器的第三個優勢在于多機器人場景中的社互動動研究,因為在該場景中多機器人的控制是非常難以實作的,并且時間成本也很高(vaughan 2008)。例如,在進化機器人的研究中,計算機仿真技術可以大幅減少測試每代機器人智能體所需要的實驗時間(nolfi和floreano 2000)。最後,使用機器人模拟器軟體還有一個更實際的優勢,也就是支援不同實驗室之間的合作研究。不同地域的研究人員可以通過相同的機器人仿真軟體共享機器人配置和任務設定參數,進而執行初步的計算實驗。這也使得一些沒有機器人研究平台的研究人員能夠和擁有真正機器人平台的實驗室進行聯合,以便将模拟工作在真實機器人平台上進行最終的聯合适應與驗證。

在下一節中我們将詳細介紹一種開源的機器人模拟器,該模拟器可以非常容易地在icub機器人上進行模組化實驗(2.5.1節)。還會介紹一款名叫webots的商用型機器人仿真軟體,它包含了各種機器人

61的身體模型(2.5.2節)。還有一個小節将描述東京大學研發的胎兒和新生兒機器人模拟器(2.5.3節)。除了這些軟體工具,還有一些在參考文獻中所涉及的其他免費和商用型模拟器。一個是免費軟體player(collett、macdonald和gerkey 2005),其中,player子產品提供對各種機器人傳感器硬體的網絡接口,stage子產品提供簡單的二維環境,gazebo子產品提供三維機器人和環境的仿真模拟。其他的免費機器人模拟器軟體還有進化型機器人evorobot(nolfi和gigliotta

2010)和simbad機器人模拟器(hugues和bredeche 2006)。并且,還有各種各樣用于機器人足球賽的模拟器,如simspark和simtwo(shafii、reis和rossetti 2011)。此外,微軟機器人工作室(microsoft robotics studio)軟體還提供了現有機器人的衆多仿真模型,如nao機器人的模型(www.microsoft.com/robotics)。

<b>2.5.1 </b>

icub機器人模拟器

作為主要的開源機器人icub模拟器(tikhanoff等人2008;tikhanoff、cangelosi和metta 2011),它的設計目标是盡可能準确地複制icub的實體和動力學屬性,并且為将icub作為發展型機器人研究基準平台提供進一步支援。該軟體公布在www.icub.org網站上。

該模拟器使用開放式動力學引擎(open dynamics engine,ode)将機器人關節表達成剛性的身體,并使用碰撞檢測的方法來處理機器人部件和環境中物體之間的實體互動。ode由模拟剛體動力學的高性能軟體庫構成,該軟體庫使用簡單的c/c++程式接口。為了能夠對各種對象的參數(如品質和摩擦力)進行操作,ode還提供了預設的多種樣式的關節種類、剛性身體、地形和建立複雜對象的網格。

模拟icub機器人的建立使用了真實的機器人規格參數。其總高度約105cm,重約20.3kg,有相同數量的自由度(53個)。機器人的身體模型是通過多種與icub機器人實際執行器相對應的關節将多個剛性身體部件連接配接而成的。模拟器中實作了所有的傳感器功能,包括手觸摸傳感器(指尖和手掌)和肩膀及臀部的力/力矩傳感器。仿真機器人扭矩參數以及這些參數在靜态或運動任務中的校驗,已經通過實驗證明具有一定的且可接受的可靠性(nava等人2008)。

  圖2-14  icub模拟器運作截圖。圖檔由vadim

tikhanoff授權提供為了促進從模拟仿真機器人到真實機器人研究工作的轉移,該軟體使用了相同的軟體基礎架構和基于yarp中間件的程序間通信。無論從裝置api角度還是從網絡通信角度來看,模拟器與實際機器人具有相同的接口,并且從使用者的角度來看,模拟器與機器人兩套系統是可以互換的。

62機器人模拟器就像真正的機器人一樣,可以直接通過通信接口和簡單的文本模式控制協定來達到控制目的。所有發送到機器人和來自機器人的指令都是基于yarp的腳本指令。至于視覺傳感器,有兩個錄影機位于機器人的眼睛位置。通過連接配接一個标準的錄影機和在一個空白的螢幕投影出機器人的形象,可以讓虛拟機器人在虛拟環境中看到真實的世界,并與人類使用者進行互動。這就是機器人的模拟眼睛看到外部世界的方式。

模拟的icub機器人可以與虛拟世界進行完整的互動(圖2-14)。模拟器的軟體提供類似yarp文法的簡單指令方式,可以動态地建立、修改和查詢對象。軟體還允許使用标準三維檔案格式的cad對象模型作為輸入。這個模拟器目前已經用于多種icub仿真實驗,例如語言學習(tikhanoff、cangelosi和metta 2011)、實作合作的心智模型(dominey和warneken 2011;第6章)以及大量基于這個模拟器的認知與抽象概念模型(詳見第8章)。

另外還有一類icub的軟體模拟器(如righetti和ijspeert 2006a,2006b),不過它們沒有達到tikhanoff模拟器那種細緻的級别。但問題是,這些模拟器都是基于專有軟體webots的(詳見2.5.2節),是以需要購買許可證才能運作icub機器人。nolfi及其合作者也研制出了一種可作為替換的icub模拟器——farsa,該模拟器是基于開源遊戲

“newton game dynamics”(牛頓實體引擎)的一款軟體,并且适用于進化機器人的實驗(massera等人2013;laral.istc.cnr.it/farsa)。

<b>2.5.2 </b>

webots機器人模拟器

webots是一款由cyberbotics有限公司研發和提供的商用機器人模拟器(michel 2004;www.cyberbotics.com),并被廣泛用于認知機器人的研究中。該軟體能夠進行多種移動機器人的仿真,包括輪式機器人、足式機器人平台和飛行機器人。webots标準版本在預設情況下包括nao類人機器人平台的三維模型(圖2-15)和用于發展型機器人研究的aibo機器人平台的三維模型。該軟體還提供了許多其他平台的三維模型,包括:katana ipr手臂型機器人(neuronics),輪式機器人e-puck(洛桑理工學院“epfl lausanne”)和kheperaⅢ(k-team corporation),hoap-2(fujitsu automation)和khr-2hv(kondo kagaku有限公司)人形機器人,darwin-op(robotis有限公司),pioneer 3-at和pioneer 3-dx(adept有限公司)平台,以及khr-3hv和khr-2hv機器人。

圖2-15  webots模拟器中nao機器人的三維模型。圖檔由cyberbotics授權提供

該軟體帶有一個機器人編輯器,通過導入vrml檔案格式來建構新的機器人平台配置。它還帶有一個世界編輯器來建立物體和地形環境(例如物體的屬性,像形狀、顔色、質地、品質、摩擦等),或者直接使用預設的世界配置。為了編輯新的機器人,webots還包括了含有傳感器和執行器的擴充庫。預定義的傳感器子產品包括:紅外和超音波距離傳感器,各種用于視覺的一維、二維、黑白、彩色錄影機,壓力和碰撞傳感器,gps傳感器,用于伺服電機的位置和力傳感器,車輪編碼器,三維加速度計和陀螺儀。這些傳感器在範圍、噪聲、響應和視野内是可控制的。執行器的庫包括:差動輪電機單元,伺服電機(用于腿、手臂、車輪),夾持器,發光二極管和電子顯示器。

機器人編輯器整合了接收器與發射器來進行機器人内部通信,是以可以模拟在機器人溝通和語言方面的多智能體系統和實驗。該軟體也帶有一個運動編輯器,用于建立和重用關節型機器人的運動序列。此外,該軟體也能夠設定實驗的監督部分,例如,用于線下執行各種各樣的實驗(如遺傳算法或與不同任務設定的訓練)。通過使用這個監督功能,研究人員可以編寫一個程式腳本,63

  ~

65如改變對象屬性及其位置的動作、給機器人發送資訊以及記錄機器人軌迹或視訊。

webots是一個多平台的應用程式,可用于windows、mac os、linux系統。該模拟器基于ode實體仿真引擎。它擁有一個由各種程式語言(如c/c++、java、python)編寫的通信接口,并且在matlab和其他機器人應用程式(ros、urbi)中編寫的程式也可以通過tcp/ip的第三方軟體作為接口。

為促進模拟器中研發的機器人控制器轉移到真實機器人平台上,除了要包含現有平台的三維模型,也需要為标準的機器人軟體應用程式提供的接口。例如,使用 nao機器人的實驗可以使用webots的urbi(gostai sas)或naoqi和“nao_in_webots”(aldebaran robotics sa),這些都可以與真實機器人或模拟機器人直接進行通信。

webots是一款商用型軟體應用程式,需要購買許可證才能使用所有功能。當然,webots也提供功能簡化的免費版本,隻能在認知機器人的實驗中進行有限的使用。

webots模拟器目前已經用于認知和發展型機器人的研究,如使用hoap-2機器人模型的雙足行走實驗(righetti和ijspeert 2006b)、使用webots模拟icub機器人的爬行實驗(righetti和ijspeert 2006a)以及使用nao機器人模型的行走實驗(lee、lowe和ziemke 2011)。

<b>2.5.3 </b>

胎兒機器人和新生兒機器人模拟器

胎兒機器人和新生兒機器人模拟器這兩個計算機仿真三維模型是由kuniyoshi及其同僚們在jsp erato asada項目中開發的。第一個模型,我們稱為fetus model 1(kuniyoshi和sangawa 2006),是最早出現的、“最簡”身體的胎兒和新生兒發展模型。随後的fetus model 2(mori和kuniyoshi 2010)提供了胎兒感覺運動裝置的更真實呈現,并且更加關注學習實驗。

這些胎兒發展模型是通過計算機模拟來實作的,目前已有的技術還不可能開發出一個漂浮在液體中的機器人胎兒。是以,這些胎兒發展模型為探索産前胎兒感覺運動的發展建立了一套有用的研究工具,這套工具能夠提供一種關于胎兒感覺器官的真實表征方式,以及身體對重力和子宮壁的反應。

fetus model 1機器人模拟器包含一個嬰兒的三維模型,這個模型模拟了子宮内胎兒和新生兒出生時的形态(kuniyoshi和sangawa 2006;sangawa和kuniyoshi 2006;如圖2-16所示)。該模型包括由19個球形身體部件與連接配接在圓柱體上的198塊肌肉(手指和面部肌肉沒有模組化)構成的一套肌肉骨骼系統。該模拟器通過與icub和webots模拟器一樣的ode實體引擎來實作。肌肉的動力學屬性和肌肉的尺寸、品質、慣性參數是基于來自人類66生理學文獻的知識。關節的設定可以使其模拟胎兒的自然姿勢和動作。總共有1448個觸覺傳感器分布在其身體的各個部位,用來反映已知的嬰兒身體敏感的觸覺。子宮環境由模拟重力、浮力和流體阻力等實體參數的球狀環境構成。連接配接胎兒和子宮壁的臍帶也會影響胎兒的運動。子宮壁則由擁有阻尼特性的非線性彈簧模組化而成。

圖2-16  kuniyoshi和sangawa 2006。圖檔由東京大學yasuo

kuniyoshi教授提供。springer授權複制該模型旨在對通用的涉身發展原則在早期感覺運動學習中的作用進行研究。特别是,該模型是以探索可以部分排序的涉身動态模式假說為目标的,這些涉身動态模式是在孕期過程中從身體-大腦-環境之間互動的無序探索中湧現出來的。這個假說随後将導緻一些有意義的運動行為的湧現,如新生嬰兒的翻身和類似爬行的動作。這個假說與人類胎兒所觀察到的自發性運動是有關聯的,自發性運動也就是一般動作,這種流暢的動作并不是對外部刺激的反應(kisilevsky和low 1998),而是在妊娠兩個月(8~10周)之後就能出現。該模型還實作了一個細緻的神經體系結構,基于的是感覺器官、髓質與脊柱模型,以及初級軀體感覺與運動區域。肌肉感覺器官的模型包括紡錘體(對肌肉拉伸速度敏感)和高爾基腱器官(與肌肉收縮成正比反應)。脊柱模型處理從紡錘體和高爾基腱器官傳遞來的成對輸入,以控制拉伸反射并使用抑制來調節肌肉張力。髓質模型由每塊肌肉的中樞模式發生器(cpg)構成。雖然兩個肌肉的cpg并不直接耦合,但是這兩個cpg可以通過身體與實體環境和肌肉的反應互動來達到功能耦合。耦合的cpg能産生周期性的活動模式,進而應對持續輸入和非均勻感覺混亂模式的輸入。神經皮層模型由互相聯系的初級軀體感覺區(s1)和運動區(m1)組成,通過自組織映射(som)人工神經網絡來實作。

該模型隻有一個與發展時間刻度相關的主要參數,也就是用于區分胎兒和新生兒的孕齡。子宮内的胎兒模型展示的是一個35周大小的胚胎。新生兒模型展示的是剛出生的嬰兒。新生兒的環境模型是一塊圍擋的正方形區域,該區域隻有重力作用,沒有像在子宮裡那樣的流體阻力作用。

對子宮内胎兒模型的自發運動的模拟,以及對在圍擋平面内新生兒自發翻滾動作的模拟,能夠顯示出豐富的有意義運動模式的湧現,還能顯示出感覺運動區域與軀體結構組織過程的湧現。胎兒模拟器也強調了在球形子宮内環境限制下的自發性胎兒運動的重要作用。子宮壁的限制會使胎兒的身體産生以旋轉為主的動作,這些動作通過感覺區s1和驅動運動區m1的構造,進而促進腿與脖子之間的協作關系的學習。67

68如果沒有這樣一種預設的胎兒環境限制和體驗,嬰兒将隻能體驗到用頭部引導的運動探索,而不會協調其他身體部位。

更複雜的胚胎模拟仿真模型是fetus model 2,該模型是随後開發出來的,它通過行為模式學習中觸覺感覺的特殊貢獻來研究子宮内學習的細化機理(mori和kuniyoshi 2010;如圖2-17所示)。這個複雜的胎兒有1542個觸覺感覺器(見圖2-17a),大部分集中頭部(365個觸點)和手部(173個)。其餘的感覺器分布在頸部(6個)、胸部與腹部(54個)、髋部(22個)、肩膀(15個)、手臂(31個)、大腿(22個)、小腿(17個)和腳(43個)。

模拟器上的實驗專注于更加複雜的行為學習,在胎兒發展過程中,這些複雜的行為是在一般運動後出現的。特别的是,模拟器探索了觸覺引起胎兒運動的假說。實驗結果表明,在胎兒身體裡使用與人類相似的觸覺分布可以引起對兩種反應動作的學習,這兩種反應動作是在胚胎的一般運動之後被觀察到的。這兩種反應動作是:①孤立的手臂或腿部動作(ialm),在人類胎兒妊娠10周之後觀察到一組獨立于其他身體部位的忽動忽停的動作;②手/臉接觸動作(hfc),手部慢慢地觸摸臉部,該動作可以在懷孕第11周被觀察到。這些結果除了可以探索出生之前運動學習的作用之外,對臨床研究也有影響。69特别是這些結果有助于了解潛在的學習能力,并應用于早産兒在新生兒重症監護病房的護理,如“築巢護理”或“襁褓法護理”(mori和kuniyoshi 2010;van sleuwen等人2007)。

圖2-17  mori和kuniyoshi

2010。圖檔由東京大學yasuo kuniyoshi教授提供。ieee授權複制

與開源的icub模拟器或商用的webots程式相比,這些胎兒和新生兒模型的仿真軟體還沒有開放使用。然而,它們提供了一個使用三維實體模拟器模型來研究機器人潛在原理的非常吸引人的執行個體,甚至這種模拟還可以發生在胚胎發展階段。這使得我們可以對胎兒的自發運動和其他認知功能的作用假說進行驗證,如先天與後天的評估行為、動力機制與認知的起源、胚胎體驗對引導出生後更複雜能力的作用。

繼續閱讀