天天看點

人工智能研究|免疫計算概述

作者:中國人工智能學會
人工智能研究|免疫計算概述

前言

如今,人工智能已成為世界高度重視的熱點領域,相關研究和應用在學術界和工業界如火如荼地進行。機器學習通常被認為是人工智能領域的熱門話題,而深度學習是機器學習中的一個熱門分支。衆所周知,深度學習,以前稱為人工神經網絡,或早期的感覺機器,起源于由人腦中的神經細胞組成的神經網絡,屬于計算智能的一個分支。

在計算智能領域,受人類資訊處理機制啟發的計算模型包括深度學習、進化計算和免疫計算。目前,深度學習就像12點鐘的太陽,深受研究和開發者的歡迎。相比之下,進化計算就像早上八點或九點鐘的太陽。今年,IEEE進化計算雜志的影響因子已達到11.169,從側面表明其影響是顯着的。至于免疫計算,隻是一個曙光,有很多不确定和未知的東西需要探索和研究。

與深度學習和進化計算不同,免疫計算的靈感來自生物免疫系統中包含的資訊處理機制。生物免疫系統是生物體的自我保護系統,具有免疫防禦、免疫監測和免疫自我穩定等功能,是一個複雜的适應性系統。是以,生物免疫系統可以看作是自然界中典型的安全智能系統,它包含着值得我們探索和研究的機制,設計了新穎高效的免疫計算理論、方法和系統。

在此背景下,邀請了西安電子科技大學賈立成先生、四川大學李濤、深圳大學林秋珍、鄭州輕工業研究所張偉偉帶領團隊,基本現狀免疫計算,以及克隆選擇算法、負選擇算法、免疫優化圖像解讀、多靶點免疫算法,希望能推動計算智能新分支的發展。

作者:羅文建

0 引言

免疫計算又稱人工免疫系統,是計算智能領域的重要新研究方向,其基本模型和算法受到生物免疫系統的啟發。從資訊處理的角度來看,生物免疫系統是一個具有自學和自我保護能力的自适應系統,它是一個典型的安全智能系統,可以為下一代計算智能、人工智能模型和方法提供靈感。國内外研究人員将生物免疫系統所隐含的資訊處理機制引入計算機科學領域,并提出了多種免疫計算模型和算法,逐漸形成了免疫計算的研究領域。

免疫計算相關研究始于20世紀80年代中期,最初發展于1990年代。1986年,法默和其他人首次提出了受生物免疫系統适應性機制啟發的機器學習模型。1990年,Bersini和Varela提出了一些使用免疫網理論解決适應性問題的想法。同年,石田提出了一種基于免疫網絡原理的并行分布式處理模型,用于分布式故障檢測。1994年,Forrest等人提出了基于免疫T細胞成熟機制和識别原理的負選擇模型和算法,這是第一個典型的免疫計算模型和方法,盡管相對簡單。然後,從20世紀90年代末至今,提出了克隆選擇算法(克隆選擇算法),人工免疫網絡(Artificial免疫網絡)和樹突狀細胞算法,并逐漸形成了免疫計算領域的四個典型研究分支,即資訊的負表示,克隆選擇算法,人工免疫網絡算法和樹突狀細胞算法。在應用方面,免疫計算模型和算法已廣泛應用于異常檢測、網絡安全、隐私保護、複雜優化問題解決、模式分析和機器學習等領域。

随着免疫計算研究的發展,一系列相關的學術活動誕生和發展起來。IEEE計算智能協會下屬的進化計算技術委員會(IEEE CIS ECTC)專門成立了人工免疫系統工作組,以促進免疫計算領域的研究和開發。近年來,在IEEE計算智能研讨會的IEEE研讨會系列中,有IEEE計算免疫計算研讨會。IEEE進化計算大會(CEC)是進化計算領域的重要會議,多年來一直舉辦人工無流行病系統特别會議。

IEEE進化計算學報、IEEE計算智能新興主題學報、應用軟計算、群體與進化計算、自然通信、資訊科學、人工智能工程應用、神經計算與應用、群體智能、遺傳程式設計與可進化》等國際知名學術期刊《機器》和《西奧計算機科學》等國際知名學術期刊均發表特刊。 免疫計算。2015年,免疫計算領域的兩位領先學者Stephanie Forrest和Dipankar Dasgupta當選為IEEE成員,他們的主要貢獻包括免疫計算研究。

1 生物免疫系統的簡要說明

生物免疫系統是生物體的自我保護系統,它代表了一系列生物結構和複雜的生物和化學反應。免疫系統對檢測和清除各種病原體和有害物質以及保護生物體的生命和健康負有重大責任。人類對免疫系統的研究有着悠久的曆史,直到今天,免疫系統仍然是人類醫學和生命科學中最重要的研究對象之一。在這些研究中,提出了克隆選擇理論、免疫網模型、免疫風險理論等許多免疫學模型和專門理論,為計算機科學技術研究人員提供了啟示,為免疫計算的誕生和發展提供了生物免疫學的基礎。

在組成方面,免疫系統由免疫器官、免疫細胞和免疫分子組成。其中,免疫器官主要負責免疫細胞的産生,如脾髒和胸腺。免疫細胞是與免疫反應過程相關的細胞,如淋巴細胞和吞噬細胞,而免疫分子大多是免疫細胞分泌的物質,如抗體和補體。

像許多系統一樣,生物免疫系統是一個分層系統,通常分為三層。第一層由皮膚和粘膜的實體屏障組成,第二層主要依靠殺菌物質和吞噬細胞的防禦功能,第一層和第二層是天生的非特異性免疫機制。第三層是特定的免疫機制,也稱為獲得性免疫,其中免疫系統識别入侵的病原體并産生特定的免疫反應;當相同的病原體再次入侵時,特異性免疫系統迅速産生強大的特異性免疫作用。值得一提的是,在免疫計算中,免疫學的理論基礎是第三層特異性免疫的理論和實驗研究成果。

2 代表性模型和算法

2.1 資訊的負面表示

資訊的陰性表示是免疫計算領域的一個重要分支。這是一種新穎的資料表示方法,靈感來自免疫T細胞的"自我非我"識别機制:在生物免疫系統中,識别"自我"的免疫T細胞被破壞,而不識别"自我"的免疫T細胞成熟并用于識别"非我"。受這種機制的啟發,負資訊表示模型的存儲和操作通常是原始資訊的補充(或子集)。負面資訊代表了三個主要的研究方向:選擇負面算法,負面資料庫和負面調查。

負選擇算法,也稱為負選擇算法,最初是由Forrest在1994年提出的,并在過去20年中得到了廣泛的研究。典型的負選擇算法可以分為三個步驟。首先,根據實際環境建構自采樣集合S。接下來,生成探測器的集合 D。特别是,D中的每個探測器都無法比對S中的任何樣本。最後,使用探測器集D監控異常資料。隻要監測的資料與D中的任何探測器比對,就被認為是異常的。

負選擇算法已應用于異常檢測、錯誤檢測、網絡和計算機安全等諸多領域。例如,Dasgupta和其他人使用負選擇算法來監控時間序列異常,Moncayo等使用負選擇算法來檢測飛機故障,Wang和其他人使用負選擇算法來識别病毒和惡意代碼。

負資料庫是資訊負表示的主要模型和重要研究方向之一,這是Esponda及其同僚在2004年左右首次提出的概念。在負資料庫中,原始資料集被存儲和操作。根據資料存儲的形式,負資料庫可以分為二進制負資料庫和真實負資料庫。目前的研究集中在二進制負資料庫上,是以這裡隻是對二進制負資料庫的簡要介紹。請記住,完整集是 U , 1, db , x1, x2, ., xm ,是包含 m 個二進制字元串的正資料庫(即.raw資料),然後 U-DB 是正資料庫的補碼。為了壓縮存儲空間,請引入符号 ,該符号用于表示0和1中的任何一個。是以,U-DB的壓縮表示形式稱為DB的負資料庫(NDB)。NDB中的每條記錄可能包含三個符号,0,1和。其中,0 和 1 的值稱為 ok 位,其中值稱為 ok 位。例如,如果DB是{000},那麼可能的NDB是。值得一提的是,二進制負資料庫可以逐個對應SAT公式,反轉負資料庫等價于解對應的SAT公式。是以,對于負資料庫的研究,可以直接利用SAT問題的許多研究成果。事實上,許多負資料庫生成算法都是由SAT公式生成算法轉換的。

負資料庫已在許多領域使用,例如隐私保護,安全身份驗證等。例如,使用負資料庫(如 Dasgupta)可避免在身份驗證過程中将身份驗證伺服器資料直接暴露給前端,而例如,Luo 使用負資料庫來提高哈希密碼身份驗證的安全性。

這項負面調查最初是由Esponda等人于2006年提出的,作為在保護受訪者隐私的同時收集敏感資訊的一種方式。當涉及到敏感或私人資訊時,如果使用傳統的問卷調查,受訪者往往不願意提供真實的資訊。在否定調查中,隻有一個(或部分)被調查使用者被要求選擇與實際情況不對應的類别(稱為負類别),并将其傳回給資料收集器。收集者在收集了使用者傳回的負類别後,可以統計地估計真實類别的分布。根據受訪者傳回的負面類别數量,負面調查可分為單選負面調查和多項選擇負面調查。根據受訪者選擇不同選項的機率,負面調查甚至可以分為負面調查和非統一負面調查,其中"一緻性"是指受訪者是否以相同的機率選擇不同的選項。

負面調查既可用于收集敏感資訊,也可用于保護資料釋出等領域。例如,Horey等人使用負調查技術收集傳感器網絡中的敏感資訊,羅等人利用負調查收集産品評價資訊用于網上購物,并于2014年提出了否定釋出的概念和相應的兩種負面資料釋出方法。

2.2 克隆選擇算法

克隆選擇算法的靈感來自生物免疫科學中的克隆選擇理論。克隆選擇算法的基本免疫學原理是,識别侵襲性病原體的免疫細胞繁殖迅速,而免疫細胞在增殖過程中發生突變,克隆突變的結果是産生更高的親和力免疫細胞,使免疫系統能夠更有效地識别和去除病原體,這是生物免疫系統自學和适應性特征的展現。

典型的克隆選擇算法由選擇、增殖、突變等基本政策組成,可分為五個步驟。

(1)初始化:随機生成含有N抗體的群體。

(2)親和力評估:逐個計算群體中每種抗體和抗原的親和力。

(3)抗體再生:根據親和力對群體中的抗體進行降序排序,選擇前n(<N)抗體進行克隆和超變異。克隆是所選抗體的複制。所謂超變異圖就是克隆抗體的突變。拷貝數和突變機率取決于抗體的親和力。

(4)抗體再選擇:評估突變後抗體的親和力,選擇最優的N抗體進入下一代群體,有時用随機生成的d(<N)抗體替換所選n""抗體中最差的d抗體,以增加群體的多樣性,避免陷入局部最優。

(5)終止判斷:如果結果符合要求,或者如果總體已經收斂,或者如果疊代次數達到預定數,則結束算法;應該注意的是,克隆選擇算法有很多個版本,盡管它們的基本架構相似,但特定的運算符(甚至特定的過程)并不完全相同。此外,在具體應用中,"抗體"和"親和力"需要根據實際問題來定義。

目前,克隆選擇算法的主要應用領域有全局優化、限制優化、組合優化、多目标優化和動态優化等複雜優化問題。除了優化問題之外,克隆選擇算法在許多其他領域也有應用,包括模式識别、機器學習和資料挖掘。例如,De Castro和Von Zuben在2002年推出的clonALG已被用于複雜優化問題解決和模式識别等領域。

2.3 人工免疫網絡

人工免疫網絡算法的靈感來自生物免疫中的免疫網絡學理論。免疫網絡學理論最早由Jerne于1974年提出,該理論的核心思想是免疫系統的元素(細胞、抗原、抗體等)不是孤立的個體,而是存在互相刺激、限制、識别等關系,整個免疫系統是動态平衡的巨大網絡。對人工免疫網絡的研究也是基于免疫網絡的學說。目前,主流中有兩種主要類型的人工免疫網絡模型,即Timmis和de Casto提出的AINE模型等。

AINE模型提出了人工識别球的概念。人工鑒定球代表由特定類型的B淋巴細胞覆寫的抗原區域,并且相似的人工鑒定球互相連接配接,形成網絡結構。在AINE模型中,資源是有限的,有限資源的配置設定由人工識别球的激活程度決定。一般來說,人工識别球的激活程度越高就可以得到

更多資源。未配置設定資源的弱人工識别球被清除,而超過門檻值被激活的人工識别球則發生克隆變異,形成新的人工識别球群體。

aiNet模型使用權重圖來表示抗體網絡模型,而該算法通過模拟生物免疫系統中的抗原刺激和免疫反應過程來運作,使用克隆選擇使産生的抗體網絡适應抗原模式。aiNet算法的主要過程:首先,針對每個抗原模式,計算抗體的親和力,根據親和力進行選擇、克隆和變異操作,重新評估突變個體并選擇好的抗體加入記憶集;其次,在處理完所有抗原模式後,根據抗體之間的親和力對記憶組中的抗體進行網絡抑制。最後,确定是否滿足終止條件或繼續執行上述步驟。人工免疫網絡算法已被用于資料挖掘、機器學習和複雜優化問題解決。例如,AINE算法是一種無監督的機器學習方法,aiNet也是如此。這兩種算法都可用于解決資料的聚類問題。此外,De Castro等人将aiNet算法應用于優化問題區域,提出了optaiNet算法,Yue等人使用aiNet算法過濾垃圾郵件并提出了ICAInet算法。

2.4 樹突狀細胞算法

樹突狀細胞算法是由生物免疫危險理論和樹突狀細胞工作機制提出的一種分類算法。在生物免疫系統中,樹突狀細胞是用于呈遞抗原的免疫細胞,最初收集抗原并接收不同的刺激信号(安全信号,危險信号,病原體相關分子模式PAMP等),根據接收信号進入半成熟狀态(更高的安全信号濃度)或成熟狀态(高風險信号或PAMP濃度等)。半成熟和成熟的樹突狀細胞向免疫T細胞呈遞抗原,但半成熟的樹突狀細胞抑制免疫反應,而成熟的樹突狀細胞刺激免疫反應。

樹突狀細胞算法模拟生物免疫系統中的樹突狀細胞如何工作。通常,典型的樹突狀細胞算法依次包括初始化、檢測、環境評估和分類。在初始化階段,生成一定大小的樹突狀細胞群,然後選擇訓練集元素中的關鍵屬性,根據屬性的實際含義和問題的需求,将其映射到不同類型的信号,包括安全信号,危險信号和PAMP信号。在檢測階段,通過未成熟的樹突狀細胞收集抗原和信号,然後計算和積累共刺激信号,半成熟信号和成熟信号的值。當累積的共刺激信号值超過遷移門檻值時,進入環境評估階段。在環境評估階段,半成熟信号值和成熟信号值中較大的一個成為小區的環境。通常,半成熟環境值記錄為 0,成熟環境值記錄為 1。最後,分類階段根據細胞環境值的總和以及mcAV量表可能引起的危害程度來計算成熟環境抗原值(MCAV)。MCAV值越接近1,抗原就越有可能有害。

Greensmith和Aickelin在2005年提出了第一個樹突狀細胞算法;目前,樹突狀細胞算法已應用于故障檢測、網絡入侵檢測等諸多領域。例如,Greensmith和其他人使用樹突狀細胞算法進行網絡入侵檢測。

3 結束語

本文介紹了免疫計算的發展曆史和生物免疫系統的多層保護機制,重點介紹了免疫計算研究的四個典型分支,包括其免疫學原理、基本内容和應用領域。生物免疫系統是一個具有适應性,自學性和穩健性的複雜系統。從資訊處理的角度來看,生物免疫系統本質上是一個典型的安全智能系統,它結合了安全與智能,可以為智能科學技術提供許多新的思路和模式,并逐漸催生了免疫計算領域。從目前的研究現狀來看,免疫計算在機器學習、資料挖掘、異常檢測、網絡安全、隐私保護等許多與人工智能和資訊安全相關的領域具有良好的發展潛力和應用前景。

(略有參考)

人工智能研究|免疫計算概述

摘自中國工業情報學會通訊

第11卷,第3期,2021年

免疫計算的主題

繼續閱讀