天天看點

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

編者注:譚鐵牛現為中國科學院副院長、中科院自動化所智能感覺與計算研究中心主任,他是中國科學院院士、英國皇家工程院外籍院士、開發中國家科學院(twas)院士、巴西科學院通訊院士、中國圖像圖形學學會理事長、中國人工智能學會副理事長。主要從事圖像處理、計算機視覺和模式識别等相關領域的研究工作,已出版編著和專著11部,并在主要的國内外學術期刊和國際學術會議上發表論文500多篇,獲準和申請發明專利80多項。曾任中科院自動化所所長、模式識别國家重點實驗室主任、中國計算機學會副理事長、國際模式識别協會副主席、ieee生物識别理事會主席,曾獲得國家技術發明二等獎、國家自然科學二等獎和國家科技進步二等獎各1項。

本文根據譚鐵牛副院長今天上午在 cncc 2016 上所做的大會特邀報告《大資料時代的模式識别》編輯整理而來,在未改變原意的基礎上稍作删減。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

各位老師、各位同學、各位同仁,大家上午好。因為時間有限,今天的報告會盡量簡略一點。另外考慮到大家不都是做模式識别,是以今天的報告不會講的太專業。

首先我注意到今年不管開什麼會、誰組織、在哪裡開,隻要和人工智能挂上邊,都很火爆。大家都在提今年是人工智能的60周年,其實今年對整個計算機科學,同樣值得紀念的一年。因為

80年以前圖靈機模式誕生 70年以前計算機誕生 60年以前才有人工智能 50年以前,計算機領域的諾貝爾獎——圖靈獎第一次頒發

是以說今年是整個計算機科學非常值得紀念的一年。

鑒于最近大家人工智能講得比較多,是以我今天要給大家講得是一個更具體的問題,也是我本人多年從事的領域——大資料時代下的模式識别。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

今天這個報告裡我主要講四個問題。它們分别是:

模式識别的基本概念和曆史 模式識别的發展現狀 大資料時代的機遇與挑戰 值得關注的研究方向
CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

首先是什麼是模式識别?

其實很好解釋,用我自己的語言來說就是:世上萬物,不管是物質的還是精神的,看得見還是看不見的都是一種模式。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

是以對這些模式進行分析與處理,進而實作描述、辨識、分類、解釋,這就是一種模式識别,後面我還講提到更多的定義。

模式識别為什麼重要?在此我要引用ray kurzwell的兩句話:

人類思維的真正力量是基于模式識别。 計算機越擅長模式識别會變得越發和人一樣。
CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

不管是哪種定義,模式識别基本都可以分為這幾個步驟:信号擷取—預處理—特征抽取—分類器設計。

當下,與其說人工智能火,不如說是深度學習火。而深度學習之是以火的原因,是因為要提升模式識别的能力(如語音識别、圖像識别等)。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

因為模式識别是作為人類的一個基本能力,同時這也是模式識别起源的一個基本動力。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

跟模式最相關的兩個熱門話題,一個當然就是機器學習,另一個則是資料挖掘。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

模式識别目前也不斷引進借助于很多其他學科的基礎理論,推動相關學科交叉快速發展。

模式識别發展簡史

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

我到現在為止,也沒查到第一次是誰、在哪裡提出了模式識别。但是我知道從18世紀、19世紀開始,數學領域中特别是統計科學就涉及到了模式識别,這也為人工智能的誕生奠定了基礎。

模式識别的發展大概是如上圖所示這麼幾個階段,從最開始一直到後來各種基礎領域出現,再一直到大資料時代。

模式識别發展到今天,我把它總結為幾句話。

模式的基礎理念不斷創新

從統計模式識别到階段模式模式識别,還有一直以來都又在研究的神經網絡。大概是這麼幾大類:

句法模式識别(規則學習) 統計模式識别(人工特征) 深度神經網絡(自動歸檔)

它們互相間的結合是未來的發展方向,我一會兒也會講到這個。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

模式識别應用領域不斷拓展

另外模式識别的應用領域一直在不斷拓展,因為能夠應用模式識别的地方實在太多,是以一直在不斷提升。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

模式識别系統性能不斷提升

模式識别系統的性能也一直在不斷提升中,比如像imagenet圖像識别賽上,它的結果一直在不斷提升中。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

模式識别的典型成功應用

語言識别、語言合成 人臉識别 虹膜識别

模式識别的成功應用很多,在此不展開講了,稍微舉幾個例子大家參看一下。

人臉識别,但雙胞胎人臉識别解決不了。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

虹膜識别,下圖展示的是在真實的煤礦場所,煤礦勞工考勤場景。為什麼用虹膜對他進行識别?因為指紋識别在這種場景下無法使用,人臉識别在上班之前可以,下班的時候就不行了。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

另外再舉一個模式識别的例子——步态識别。為什麼要特别提到步态識别這個例子呢?因為目前相對來說還有一點挑戰。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

在你相距幾十米遠的時候,虹膜也好、人臉也好,你無法進行識别。

另外一個挑戰就是,他是從正面走來,還是從側面走來。最近借助于深度學習,這個部分也有了一些新的進展。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

還有一個例子是智能視覺監控,在此就不展開詳細講述了。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

現有模式識别的局限性

盡管模式識别在很多領域都成功應用,但還是有巨大的挑戰。在此我想再引用robert m.haralick和thomas g.dletterich的兩句話:

計算機視覺(模式識别)的根本問題是一個魯棒性問題,如果不考慮魯棒性問題,計算機視覺幾乎所有問題都解決了。 現階段隻能系統需要在開發環境下具有自适應性,對噪聲具有魯棒性。

核心的意思就是它的局限性受限于魯棒性和自适應性。如果這兩個問題解決了,很多問題就能迎難而解。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

大資料的出現、深度學習的性能提升在一定程度上解決了魯棒性、自适應性的問題,但是跟人相比還有巨大的差距。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

是以這個領域還需要我們繼續去努力學習,深度學習盡管取得很大成功,但是跟人的相比它的魯棒性、自适應性、泛化能力有很大差距。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

是以,我把現狀概括這麼幾句話:

面向特定任務的模式識别已取得突破性進展,有的性能可與人媲美。 統計與基于神經網絡的模式識别目前占主導地位,深度學習開創了新局面。 通用模式識别依然任重道遠。 魯棒性、自适應性和可泛化性是一個進一步發展的三大瓶頸。
CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

我們目前實實在在的處在大資料時代,大資料的價值不在于大資料本身,而在于它内容的了解與識别,而這裡面很多就是模式識别的問題。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

是以我覺得第一個機遇,就是把大資料變成知識、變成決策能夠依據的根據。而發掘這個金庫的鑰匙就是模式識别,隻有這樣才能實作“from data bonanza to data bonus”。

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

機遇2:推動理論和方法創新

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

機遇3:加速學科領域交叉和滲透

加速學科領域交叉和滲透主要分兩個方面:

以資料驅動為代表的分析方法在大資料時代具有廣泛用武之地,使得若幹傳統學科(如神經科學)等的研究方法也出現了巨大創新,為模式識别方法拓展到其他領域的方法中帶來了重要契機。 相關領域在大資料時代的原創成功也能夠對模式識别理論與方法帶來影響,進而推動模式識别學科與其他學科的協同創新。
CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

機遇4:引導科技發展新變革

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

機遇和挑戰同在,機遇抓不住也是挑戰。

挑戰1:複雜的大資料

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

挑戰2:計算效率和性能

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

挑戰3:大資料的語義計算與了解

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

語義就是人們根據自己對現實世界的了解而賦予資訊的解釋。

挑戰4:大資料了解需要資訊論的創新

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

還是那句話,在這些機遇和挑戰面前,盡管我們講機遇大于挑戰,但是機遇抓不住就是挑戰,挑戰解決不了,那就是機遇。

一、面向大規模多源異構資料的魯棒特征表達

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

二、結構與統計相結合的模式識别新理論

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

三、資料與知識相結合的模式識别

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

四、具有魯棒性和自适應性的生物啟發模式識别

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

五、基于跨領域跨模态知識遷移的模式識别

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

六、以網際網路為中心的模式識别

CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别
CNCC 2016 | 中科院譚鐵牛:大資料時代的模式識别

模式識别是人工智能的核心内容,是大資料時代的關鍵使能技術。

大資料帶給模式識别諸多新的機遇與挑戰。

大資料時代的模式識别具有十分廣闊的創新空間與發展前景。

本文作者:李尊

繼續閱讀