天天看點

論文精選 | AI學習也要先定個小目标,讓人工智能具有社會意識——《具有社會意識的多智能體學習:面向社會最優解》

應用場景導讀:多智能體系統,例如移動傳感器、無人運載器等,作為分布式人工智能研究的一個重要分支,由于其具有較強的容錯性、魯棒性和可擴充性等優點,被廣泛地應用于軍事、工農業生産、醫學、交通、服務等各個領域。多智能體系統是由多個具有計算和移動能力的智能體所組成的集合,其中每個智能體是一個實體的或抽象的實體,能作用于自身和環境,并與其它智能體通訊。

論文精選 | AI學習也要先定個小目标,讓人工智能具有社會意識——《具有社會意識的多智能體學習:面向社會最優解》

标題:

具有社會意識的多智能體學習:面向社會最優解

摘要:

在多智能體系統中,學習能力對每個智能體來說至關重要,這關乎其在動态環境中面對未知對手時如何正常反應。從系統設計者的角度說,非常希望智能體能學會面向社會最優解的協作,同時避免被自私的對手利用。為此,我們提出一種新穎的梯度提升算法(sa-iga),通過将社會意識納入政策更新過程來加強基本的梯度提升算法。我們從理論上分析了基于動态系統理論的sa-iga的學習動态,并且sa-iga在包括對稱遊戲的衆多遊戲中都有線性動态。對兩個代表遊戲(“囚徒困境”遊戲和協調遊戲)的學習動态進行了詳細分析。在sa-iga概念的基礎上,我們進一步提出一個基于q學習更新規則的多智能體學習算法,稱為sa-pga。仿真結果表明,sa-pga智能體相比以前面向有條件聯合行動學習者(cjal)的社會最優準則,可以獲得更高的社會福利,并通過納什均衡解決方案對獨立理性對手具有可抗性。

第一作者簡介:

李曉紅,女,1965年9月出生,工學博士學位,天津大學計算機及資訊技術系、教授,博士生導師。計算機學會進階會員,acm會員、軟體工程專委會委員;全國高等學校計算機教育研究會 常務理事;天津大學女工委員,學院工會副主席。近年來緻力于安全軟體工程、可信軟體及資訊安全領域的研究工作。

計算機學會進階會員,acm會員、軟體工程專委會委員;全國高等學校計算機教育研究會 常務理事;國家科技獎勵評審專家;教育部學位與研究所學生教育發展中心學位論文評審、學科建設和評估咨詢專家 ;《計算機學報》、《計算機科學》等雜志審稿專家;軟體工程、資訊安全相關領域國際期刊、國際會議審稿專家;計算機學院學位委員會委員、學術委員會委員、學科建設委員會成員、教學指導委員會委員兼秘書;學院985專家組成員兼秘書;天津大學女工委員,學院工會副主席。

近年來主持或參與完成國家級、省部級以及橫向科研課題近20項,近年來已發表學術論文50餘篇,其中學位與研究所學生教育重要期刊20多篇,國際會議20多篇,被ei檢索20多篇, sci檢索6篇。申報國家發明專利20餘項,已授權6項。軟體著作權4項。專著1部,獲省部級科技獎1項。現作為項目負責人主持國家基金重點項目1項(子課題負責人)、國家基金面上項目1項,天津市基礎重點項目1項、企業合作項目1項。

via pricai 2016

<a href="https://pan.baidu.com/s/1qx82brq" target="_blank">論文原檔案下載下傳</a>

雷鋒網按: 本文由雷鋒網(公衆号:雷鋒網)獨家編譯,未經許可禁止轉載!

論文精選 | AI學習也要先定個小目标,讓人工智能具有社會意識——《具有社會意識的多智能體學習:面向社會最優解》

本文作者:陳楊英傑

繼續閱讀