天天看點

壓縮傳感Shihao Ji

由來

  采樣定理(又稱取樣定理、抽樣定理)是采樣帶限信号過程所遵循的規律,1928年由美國電信工程師H.奈奎斯特首先提出來的,是以稱為奈奎斯特采樣定理。1948年資訊論的創始人C.E.香農對這一定理加以明确說明并正式作為定理引用,是以在許多文獻中又稱為香農采樣定理。該理論支配着幾乎所有的信号/圖像等的擷取、處理、存儲、傳輸等,即:采樣率不小于最高頻率的兩倍(該采樣率稱作Nyquist采樣率)。該理論指導下的資訊擷取、存儲、融合、處理及傳輸等成為目前資訊領域進一步發展的主要瓶頸之一,主要表現在兩個方面:   (1)資料擷取和處理方面。對于單個(幅)信号/圖像,在許多實際應用中(例如,超寬帶通信,超寬帶信号處理,THz成像,核磁共振,空間探測,等等), Nyquist采樣硬體成本昂貴、擷取效率低下,在某些情況甚至無法實作。為突破Nyquist采樣定理的限制,已發展了一些理論,其中典型的例子為Landau理論, Papoulis等的非均勻采樣理論,M. Vetterli等的 finite rate of innovation信号采樣理論,等。對于多道(或多模式)資料(例如,傳感器網絡,波束合成,無線通信,空間探測,等),硬體成本昂貴、資訊備援及有效資訊提取的效率低下,等等。   (2)資料存儲和傳輸方面。通常的做法是先按照Nyquist方式擷取資料,然後将獲得的資料進行壓縮,最後将壓縮後的資料進行存儲或傳輸,顯然,這樣的方式造成很大程度的資源浪費。另外,為保證資訊的安全傳輸,通常的加密技術是用某種方式對信号進行編碼,這給資訊的安全傳輸和接受帶來一定程度的麻煩。   綜上所述:Nyquist-Shannon理論并不是唯一、最優的采樣理論,研究如何突破以Nyquist-Shannon采樣理論為支撐的資訊擷取、處理、融合、存儲及傳輸等的方式是推動資訊領域進一步往前發展的關鍵。衆所周知:(1)Nyquist采樣率是信号精确複原的充分條件,但絕不是必要條件。(2)除帶寬可作為先驗資訊外,實際應用中的大多數信号/圖像中擁有大量的structure。由貝葉斯理論可知:利用該structure資訊可大大降低資料采集量。(3) Johnson-Lindenstrauss理論表明:以overwhelming性機率,K+1次測量足以精确複原N維空間的K-稀疏信号。   近年來,由D. Donoho(美國科學院院士)、E. Candes(Ridgelet, Curvelet創始人)及華裔科學家T. Tao(2006年菲爾茲獎獲得者,2008年被評為世界上最聰明的科學家)等人提出了一種新的資訊擷取指導理論,即,壓縮感覺或壓縮傳感(Compressive Sensing(CS) or Compressed Sensing、Compressed Sampling)。該理論指出:對可壓縮的信号可通過遠低于Nyquist标準的方式進行采樣資料,仍能夠精确地恢複出原始信号。該理論一經提出,就在資訊論、信号/圖像處理、醫療成像、模式識别、地質勘探、光學/雷達成像、無線通信等領域受到高度關注,并被美國科技評論評為2007年度十大科技進展。目前CS理論的研究尚屬于起步階段,但已表現出了強大的生命力,并已發展了分布CS理論(Baron等提出),1-BIT CS理論(Baraniuk等提出),Bayesian CS理論(Carin等提出),無限維CS理論(Elad等提出),變形CS理論(Meyer等提出),等等,已成為數學領域和工程應用領域的一大研究熱點。

基本知識

  核心思想是将壓縮與采樣合并進行,首先采集信号的非自适應線性投影 (測量值),然後根據相應重構算法由測量值重構原始信号。壓縮傳感的優點在于信号的投影測量資料量遠遠小于傳統采樣方法所獲的資料量,突破了香農采樣定理的瓶頸,使得高分辨率信号的采內建為可能。   壓縮傳感理論主要包括信号的稀疏表示、編碼測量和重構算法等三個方面。信号的稀疏表示就是将信号投影到正交變換基時,絕大部分變換系數的絕對值很小,所得到的變換向量是稀疏或者近似稀疏的,以将其看作原始信号的一種簡潔表達,這是壓縮傳感的先驗條件,即信号必須在某種變換下可以稀疏表示。通常變換基可以根據信号本身的特點靈活選取,常用的有離散餘弦變換基、快速傅裡葉變換基、離散小波變換基、Curvelet基、Gabor 基 以及備援字典等。 在編碼測量中,首先選擇穩定的投影矩陣,為了確定信号的線性投影能夠保持信号的原始結構,投影矩陣必須滿足限制等距性 (Restricted isometry property, RIP)條件,然後通過原始信号與測量矩陣的乘積獲得原始信号的線性投影測量。最後,運用重構算法由測量值及投影矩陣重構原始信号。信号重構過程一般轉換為一個最小L0範數的優化問題,求解方法主要有最小L1 範數法、比對追蹤系列算法、最小全變分方法、疊代門檻值算法等。

應用領域

  壓縮傳感技術是一種抽象的數學概念,而不是具體的操作方案,它可以應用到成像以外的許多領域。以下隻是其中幾個例子:   磁共振成像(MRI):在醫學上,磁共振的工作原理是做許多次(但次數仍是有限的)測量(基本上就是對人體圖像進行離散拉東變換(也叫X光變換)),再對資料進行加工來生成圖像(在這裡就是人體内水的密度分布圖像)。由于測量次數必須很多,整個過程對患者來說太過漫長。壓縮傳感技術可以顯著減少測量次數,加快成像(甚至有可能做到實時成像,也就是核磁共振的視訊而非靜态圖像)。此外我們還可以以測量次數換圖像品質,用與原來一樣的測量次數可以得到好得多的圖像分辨率。   天文學:許多天文現象(如脈沖星)具有多種頻率震蕩特性,使其在頻域上是高度稀疏也就是可壓縮的。壓縮傳感技術将使我們能夠在時域内測量這些現象(即記錄望遠鏡資料)并能夠精确重建原始信号,即使原始資料不完整或者幹擾嚴重(原因可能是天氣不佳,上機時間不夠,或者就是因為地球自傳使我們得不到全時序的資料)。   線性編碼:壓縮傳感技術提供了一個簡單的方法,讓多個傳送者可以将其信号帶糾錯地合并傳送,這樣即使輸出信号的一大部分丢失或毀壞,仍然可以恢複出原始信号。例如,可以用任意一種線性編碼把1000比特資訊編碼進一個3000比特的流;那麼,即使其中300位被(惡意)毀壞,原始資訊也能完全無損失地完美重建。這是因為壓縮傳感技術可以把破壞動作本身看作一個稀疏的信号(隻集中在3000比特中的300位)。 壓縮感覺(compressed sensing)。所謂壓縮感覺,最核心的概念在于試圖從原理上降低對一個信号進行測量的成本。比如說,一個信号包含一千個資料,那麼按照傳統的信号處理理論,至少需要做一千次測量才能完整的複原這個信号。這就相當于是說,需要有一千個方程才能精确地解出一千個未知數來。但是壓縮感覺的想法是假定信号具有某種特點(比如文中所描述得在小波域上系數稀疏的特點),那麼就可以隻做三百次測量就完整地複原這個信号(這就相當于隻通過三百個方程解出一千個未知數)。可想而知,這件事情包含了許多重要的數學理論和廣泛的應用前景,是以在最近三四年裡吸引了大量注意力,得到了非常蓬勃的發展。陶哲軒本身是這個領域的創始者之一(可以參考《陶哲軒:長大的神童》一文),是以這篇文章的權威性毋庸諱言。另外,這也是比較少見的由一流數學家直接撰寫的關于自己前沿工作的普及性文章。需要說明的是,這篇文章是雖然是寫給非數學專業的讀者,但是也并不好懂,也許具有一些理工科背景會更容易了解一些。 壓縮感覺(Compressed sensing),也被稱為壓縮采樣或稀疏采樣,是一種利用稀疏的或可壓縮的信号進行信号重建的技術。這一方法至少已經存在了四十年,由于David Donoho、Emmanuel Candes、Justin Romberg和陶哲軒的工作,最近這個領域有了長足的發展。

壓縮傳感基礎理論

Emmanuel Candès, Compressive sampling. (Int. Congress of Mathematics, 3, pp. 1433-1452, Madrid, Spain, 2006)

Richard Baraniuk, Compressive sensing. (IEEE Signal Processing Magazine, 24(4), pp. 118-121, July 2007)

Emmanuel Candès and Michael Wakin, An introduction to compressive sampling. (IEEE Signal Processing Magazine, 25(2), pp. 21 - 30, March 2008) [High-resolution version]

Justin Romberg, Imaging via compressive sampling. (IEEE Signal Processing Magazine, 25(2), pp. 14 - 20, March 2008)

壓縮感覺重構算法

Joel Tropp and Anna Gilbert, Signal recovery from random measurements via orthogonal matching pursuit. (IEEE Trans. on Information Theory, 53(12) pp. 4655-4666, December 2007)

David Donoho and Yaakov Tsaig, Fast solution of ell-1-norm minimization problems when the solution may be sparse. (Stanford University Department of Statistics Technical Report 2006-18, 2006)

Mário A. T. Figueiredo, Robert D. Nowak, and Stephen J. Wright, Gradient projection for sparse reconstruction: Application to compressed sensing and other inverse problems. (IEEE Journal of Selected Topics in Signal Processing: Special Issue on Convex Optimization Methods for Signal Processing, 1(4), pp. 586-598, 2007)

Karen Egiazarian, Alessandro Foi, and Vladimir Katkovnik, Compressed sensing image reconstruction via recursive spatially adaptive filtering. (Preprint, 2007)

壓縮感覺(Compressive Sensing)與結構化稀疏性(Structured Sparsity)2009-07-17 10:45 在處理研究方法的一般與特殊性關系中,不僅要強調一般理論方法對特殊研究活動的指導作用,也需要注重特殊研究活動對一般理論的補充、豐富和發展作用。一般性和特殊性的螺旋式發展過程是科學研究的普遍規律。壓縮傳感是基于信号的一般稀疏性建立的資訊擷取或信号采樣理論。将其用于特殊信号的壓縮傳感,就需要考慮信号特有的結構化稀疏性。已有的研究結果表明,具有結構化稀疏性的壓縮傳感能獲得更好的壓縮性能。人體的運動行為無論是在空域還是時域上都有自己特殊的稀疏限制,無疑是我們值得探讨的問題。 壓縮信号的稀疏性在壓縮傳感中的角色與傳統采樣理論中的Nyquist采樣頻率類似,是實作壓縮重構的必要條件之一(注:另一個條件是壓縮投影與稀疏表示基陣的非相幹條件,随機壓縮投影普遍滿足這一限制條件,是以可以認定是自然滿足的條件)。具體而言,為了重構N維K水準稀疏的壓縮信号,需要的壓縮測量(采樣)數目理論上不低于O(Klog(N/K)),即正比于稀疏水準,通常需要2K以上的壓縮測量。考慮最極端的例子,知道K個非零值的位置,那麼壓縮測量的數目就隻需要K了,即達到了壓縮感理論可能的下界。更一般地,若從先驗知識獲得非零值位于若幹個K維子空間,且子空間的數目遠遠低于平凡的(N,K)組合數,那麼壓縮測量的數目可以約減到K+C的水準,無疑這是對一般壓縮傳感性能的提升。回到運動目标檢測與跟蹤的問題,由RST實作的空間胞元分割數目可對應N,運動目标形成的熱輻射源占有K個胞元(依賴于觀測粒度,取決于透鏡的焦距和視場的空間尺度),這K個胞元在空域上必将滿足特定的限制,這種限制在時域上也會遵從某種可預測的規律變化,形成稀疏性的特有結構和模型。利用好稀疏性的結構特性,可以有效減少感覺單元中需要的熱釋電感受器數目,理論價值和實踐意義都是十分重要的。 為了利用這些稀疏性的結構特征,需要對目前我們設計的體系結構進行重新的審視,以便減少熱釋電紅外感受器的數目,形成更為緊湊的感覺單元,适應大型監測網絡環境的部署要求。

壓縮感覺(CS)理論是在已知信号具有稀疏性或可壓縮性的條件下.對信号資料進行采集、編解碼的新理論.主要闡述了CS理論架構以及信号稀疏表示、CS編解碼模型,并舉例說明基于壓縮感覺理論的編解碼理論在一維信号、二維圖像處理上的應用.

稀疏表示和壓縮感覺有何異同?

壓縮感覺中對于矩陣本身的限制很多,為了保證算法收斂到最稀疏的解,比如衆多的RIP限制就是為了保證l1最小優化算法收斂到l0最小的解。

如果單單從表示的角度來看,我們并不一定要求最稀疏的解是唯一的。從這個角度來看,cs與稀疏表示還是存在很大的不同的。不知各位有何見解!

這個問題,我個人認為是沒有必要認為他不同的。而且,這和國外一些證明有關。

首先稀疏信号和壓縮傳感是同一個問題的,稀疏信号可以看成,對于一個信号,如何用最稀疏的基表示。這是已知原始信号。還有一種形式就是,已知一個不完全的結果。比如,損壞了什麼的原因,我們知道了在基下變換的結果,那麼是否可以恢複原始信号?答案是在原始信号稀疏情況下,在滿足一定條件下,是可以恢複的。這兩個問題都是可以用l0範數表示的。壓縮傳感可以說是結合這兩種過程,先采樣,後重建。但是由于這兩個過程是對應的。是以也是一個L0問題。

對于這種問題,國外都是喜歡提出一種算法,或者是理論。證明在這種情況下。是可以實作的。也就是所提出的理論=》解決問題。但是,是不是這個問題就隻能這樣解呢?這可能還需要一些理論證明吧。是以有人說,等距限制是充分但不是必要條件吧。(聽别的同學說有的文章有這樣的觀點)。

的确壓縮傳感不是最稀疏的表示,對于稀疏為K的信号,使用L0範數其實要K+1個就可以表示了。使用L1範數的用a*K。因為解L0範數難度太大。這樣看壓縮傳感是考慮了開始的表示和最後的重建提出的。即可以降低資料,又可以實作比較快的算法(L1範數最小)重建。

但是,我個人認為從稀疏信号了解這個問題是比較好的。如果你可以找到一種L0範數,比較好的重建算法的話。那麼就絕對比現在理論好。從根源了解問題絕對比了解部分深刻。同時,現在的壓縮傳感很多都抛棄了L0範數。難道L0範數真的不值得我們去留戀嗎??

稀疏信号解的問題可以擴散到好多問題的,比如:《A Unified Approach to Sparse Signal Processing》介紹的。不僅僅是壓縮感覺一方面的。

就我個人的了解,CS是建立在一個信号可以在某個基底下被稀疏表示或者近稀疏表示(稀疏表示+被bound的error)。對于這個K-sparse的稀疏表示,我們可以用O(K*log(N/K))個mesurements得到一個相應長度的測量值。并且能夠在已知這個測量值,測量矩陣以及K的情況下還原原始信号的稀疏表示。這裡的O(K*log(N/K))是基于l_1norm的。l_0norm當然好,對于一些特殊結構的信号l_0norm遠比l_1norm有效率。問題是這樣的信号并不是很多。CS理論考慮的是所有可以被稀疏表示的信号,一般情況下,解這樣的l_0優化問題是NP-hard的,這就是為什麼絕大部分學者在研究l_1優化或l_1penalized least squares。也有少部分學者(如chartrand)在研究nonconvex CS,即l_p(0<p<1)優化。

如果某個信号在正交基上沒有稀疏表示,顯然無法用正交基來實作CS。

對于信号X,如果用Y=ΦX來直接擷取觀測值

而恢複算法是根據min||α||,s.t Y=ΦX=Φψα(其中X=ψα,α為信号X在正交基ψ上的分解系數)

如果信号X在正交基ψ上不是稀疏的,那麼CS就基本失效。 CS其實就是一個降維過程,對于一個1xN的信号X,要完全恢複的話,需要采樣N次,這就相當于是一個N乘N的方程組,可以得到唯一解。

如果信号滿足稀疏性(假如為K稀疏),那麼隻要采樣N>>M≥K個測量值,就可以在一個非滿秩的方程組中,通過min||α||的恢複算法來重建信号X。 在這種情況下,可以采用一個有備援的dictionary(非正交的)來對信号X進行稀疏表示,然後才能通過上述的恢複算法來重建信号。

闫敬文,男,1964年生,教授,理學博士,中國民主同盟會會員,中國通信學會會員,中國圖像圖形學會會員,中國業餘無線電會員吉林省首批會員。1987年畢業于吉林工業大學,獲工學學士學位;1992年7月獲得中國科學院長春地理研究所地圖學與遙感(研究方向:微波遙感)理學碩士學位,并配置設定到長春郵電學院任教;1997年獲得中國科學院長春光機所理學博士學位(研究方向:光學遙感及應用)。現主要從事遙感圖像處理、資料壓縮、通信理論、小波分析理論和應用研究工作。著作《超小波分析及應用》 通常情況下,欠定線性方程是沒有唯一解的,如果加上其他的條件則可以縮小解得範圍,比如加上二範數最小化這個條件,則方程可以得到最小範數解,該解唯一,我們知道二範數是能量的度量機關,它是用來度量重構誤差的,如果我們不用二範數改用另外的附加條件,比如稀疏性,要求方程的解具有最小數目的非零項,也就是零範數,那麼方程到底有沒有唯一解,怎麼證明求得的是全局解而不是局部解,此外假設有全局的唯一解,那麼求解過程呢,是一個NP問題,既然零範數具有現實意義,那麼可不可以找它的近似解呢,這就引出了l1範數最小化問題,用1範數來代替0範數的話,他們最終求的解是不是一緻,是不是1範數求的解一定是0範數解的近似值,這兩個解得誤差有多大,是不是可以被接受,當然這些問題不屬于我們這些搞圖像處理的小魚小蝦來研究,我們隻需要接受結果就行,剩下的證明推導是那些搞應用數學的大牛的事情。 再看一下信号處理領域的Sparse,我們應該熟悉JPEG跟JPEG2000的差別吧,JPEG的核心算法是DCT,而後者是DWT,本質上,這兩種處理方法都是将信号從一個域變換到另外一個域(把坐标系進行旋轉,将信号投影到不同的基上),進而獲得信号的稀疏表示,即用最少的系數來表示信号,不過DWT比DCT更加稀疏而已。信号不同,對應最稀疏表達的基也會不同,比如,對于一維信号可能小波基是最稀疏的,而對于圖像而言,可能那些Curvelet和contourlet是最優的,對于有些信号,也有可能需要将幾種基結合起來才是最優的。當然,我們可以通過求解零範數問題來得到信号的最稀疏表達。 當然求解信号的稀疏表達問題,被分成兩種類型:L1範數最小化,和啟發式的貪婪算法。L1範數最小化是通過用L1範數來近似0範數,取1而不取1/2,2/3或者其他值,是因為1範數最小化是凸優化問題,可以将求解過程轉化成有一個線性規劃問題。 關于壓縮感覺的了解

對于壓縮感覺,最開始提出的令人振奮的是可以低于奈奎斯特采樣頻率來采樣,實作信号的壓縮傳感。首先我不知這個采樣是不是展現測量矩陣和源信号的乘積上?,如果是的話,我們來分析:給定一個源信号,長度為n*1,測量矩陣為m*n,故觀測信号大小為m*1,其中m<n,在擷取觀測信号的過程中,觀測信号的每一個元素mi為測量矩陣的每一行和源信号的内積,也就是說這樣采樣是采了源信号的每一個點,不能說是欠采樣。是以,壓縮感覺的本質應該是把一個長度為n的信号壓縮成長度為m的信号,最後我們通過長度為m的信号來重構出長度為n的信号(利用源信号滿足稀疏性或者源信号在變換域中滿足稀疏性),歸結為解一個欠定方程組的問題。故,壓縮感覺隻是一個新概念,分析方法都是稀疏分量分析的一些方法,壓縮感覺隻是稀疏分量分析的一個應用而已。

http://ccvai.xjtu.edu.cn/fund.do?method=getfunddetailbyid&id=36 壓縮感覺理論及其研究進展

http://www.docin.com/p-42423226.html

基于壓縮感覺認知模型的面像識别與了解 面像識别是模式分類、圖像處理、計算機視覺、機器學習等領域的研究熱點,其研究不但對于模式識别理論發展具有重要的學術意義,而且有着廣泛的産業化前景,進而有可能為國家的經濟建設做出貢獻。本項目根據壓縮感覺原理,結合人的認知實際,提出嶄新的視覺認知模型。該模型将測試樣本表示為訓練集(字典)的線性組合,組合系數的稀疏性與稀疏集中度可以用來衡量其類别屬性。本項目将重點研究:(1)小樣本條件下的降維與稀疏表示;(2)多重回歸分析中的最優響應變量構造;(3)基于超分辨率重建技術與正則化政策的圖像品質恢複;(4)大規模優化計算與線上學習算法;(5)面像認知與識别系統。項目的創新之處在于整合認知科學、信号處理、非線性優化、線上學習等理論,提出基于壓縮感覺的視覺認知模型并應用于面像識别領域,以解決小樣本及非線性變化(畸變、遮擋等)問題。本課題的研究将豐富模式識别與機器學習理論,并為面像識别問題提供新的解決途徑。 與人類視聽覺感覺密切相關的圖像、語音和文本(語言)資訊在社會、經濟和國家安全等領域中扮演着重要角色,并在今後一段時間内仍将迅猛增長。這類資訊可被人類直接感覺和了解,也可用計算機進行處理,但計算機的處理能力遠遜于人類且處理效率遠不能滿足當今社會的發展需求。如何借鑒人類的認知機理和相關數學的最新研究成果,建立新的計算模型和方法,進而大幅度提高計算機對這類資訊的了解能力與處理效率,不僅可有力推動資訊科學的快速發展,也将為國民經濟和社會發展做出重大貢獻。 一、科學目标

本重大研究計劃的總體科學目标是:圍繞國家重大需求,充分發揮資訊科學、生命科學和數理科學的交叉優勢,從人類的視聽覺認知機理出發,研究并建構新的計算模型與計算方法,提高計算機對非結構化視聽覺感覺資訊的了解能力和海量異構資訊的處理效率,克服圖像、語音和文本(語言)資訊處理所面臨的瓶頸困難,為確定國家安全與公共安全、推動資訊服務及相關産業發展以及提高國民生活和健康水準做出重要貢獻。具體表現為:在視聽覺資訊處理的基礎理論研究方面取得重要進展;在視聽覺資訊協同計算、自然語言(漢語)了解以及與視聽覺認知相關的腦―機接口等三項關鍵技術方面取得重大突破;內建上述相關研究成果,研制具有自然環境感覺與智能行為決策能力的無人駕駛車輛驗證平台,主要性能名額達到世界先進水準,進而提升我國在視聽覺資訊處理領域的整體研究實力,培養具有國際影響力的優秀人才與團隊,為國家安全和社會發展提供相關研究環境與技術支撐。 二、核心科學問題

本重大研究計劃将圍繞“感覺特征提取、表達與整合”、“感覺資料的機器學習與了解”和“多模态資訊協同計算”等核心科學問題,組織并實施如下四個主要方面的研究工作。 (一)圖像與視覺資訊計算

主要研究圖像與視覺資訊計算的認知機理,視覺基本特征的提取與選擇,物體識别與圖像内容了解,複雜場景下運動目标的行為分析等。提出若幹圖像與視覺資訊的高效計算模型,取得國際公認的原創性研究成果(在Nature, Science, IEEE Trans. PAMI等刊物上發表高水準論文),培養具有國際影響力的優秀人才與研究團隊。 (二)語音與聽覺資訊計算

主要研究聽覺感覺機理與語音場景分析,自然環境下的語音識别與高表現力的語音合成,口語對話分析與了解等。取得在國際上有影響的原創性研究成果,提出若幹語音與聽覺資訊的有效計算模型,在本領域國際權威刊物上發表高水準論文,培養具有國際影響力的優秀人才與研究團隊。 (三)自然語言(漢語)了解

主要研究語言加工的認知機理,語言知識模組化和語義計算模型,面向網絡的漢語适度了解模型和系列分析工具,支援自然環境下口語對話分析、識别與了解的關鍵技術等。在國内已有相關成果的基礎上,統籌建構大規模高标準漢語語義知識庫。将上述研究成果應用到語言(漢語)資訊處理典型系統中,顯著提高對自然語言(句子、段落、篇章)的了解能力,并在網絡資訊檢索、過濾和知識擷取方面得到驗證。 (四)多模态資訊的協同計算與腦—機接口

主要研究多模态感覺資訊協同的認知機理與計算模型,基于視聽覺資訊融合的模式識别與環境互動方法,跨模态視訊資訊檢索與網絡敏感資訊過濾技術等。大幅度提高跨模态視訊資訊檢索的查準率,顯著提升本領域整體研究實力。

研究與視聽覺認知相關的腦信号提取、腦區定位與腦功能網絡分析方法和技術,腦—機互動中的信号傳輸、處理與控制技術,與視聽覺認知相關的腦—機接口典型應用。在改善殘障人士生活品質和功能康複等方面得到驗證或應用,為延伸和提高人類行為控制能力提供新技術。 三、關鍵技術與內建驗證平台

在上述研究工作的基礎上,本重大研究計劃進一步開展與視聽覺資訊處理相關的關鍵技術和內建驗證平台研究。 (一)視聽覺資訊協同計算的關鍵技術

研究機器視聽覺資訊的協同計算模型及系統實作技術,基于視聽覺資訊融合的模式識别技術與驗證系統,跨模态視訊資訊檢索與網絡敏感資訊過濾技術及應用。基于多模态協同計算模型的網絡視訊資訊搜尋的查準率比同期國外最好水準高5%—10%,并在網絡資訊安全與服務等領域得到驗證。 (二)自然語言(漢語)了解關鍵技術

研究漢語通用詞彙的規範化語義知識庫及其建構技術,面向網絡的漢語适度了解模型及系列分析工具的實作技術,支援自然環境下口語對話分析、識别與了解的關鍵技術。在國内現有相關成果的基礎上,統籌建構漢語語義知識庫,漢語通用詞彙規模不小于5萬詞,帶有語義标注的漢語平衡語料庫規模不小于1千萬字。将研究成果應用到網絡環境下的漢語處理系統中,資訊檢索與知識擷取的準确率比現有最好技術明顯提高。 (三)與視聽覺認知相關的腦―機接口關鍵技術

研究與視聽覺認知相關的腦信号提取、腦區定位與腦功能網絡分析技術,腦—機互動中的信号傳輸、處理、控制技術及系統實作,與視聽覺認知相關的腦—機接口典型應用。所提無創腦―機接口資訊提取與分析等技術處于同期國際領先水準,在改善殘障人士生活品質和功能康複等方面得到驗證或應用。 (四)無人駕駛車輛內建驗證平台

內建上述基礎理論與關鍵技術的相關研究成果,将傳統視覺計算模型與新的視覺認知模型相結合,實作環境感覺與模組化方法新突破;實作多傳感器跨模态跨尺度資訊融合,生成高品質三維場景認知地圖,建構高性能智能車輛無人駕駛驗證平台;提供新的基于人—車—路狀态綜合分析的智能輔助安全駕駛關鍵技術;在國防、智能輔助安全駕駛等相關領域得到驗證或應用并産生重要影響。 四、項目資助

本重大研究計劃的實施周期為8年(2008年8月至2015年12月),拟投入總經費為1.5億元。

本重大研究計劃主要以“培育項目”、“重點支援項目”和“內建項目”的形式予以資助,三類項目在資助強度和實作目标上有所不同。對有較好的創新學術思路和研究價值,但尚需進一步探索研究的申請項目,将以“培育項目”方式予以資助(約為50萬元/項);對有很好的創新學術思想和研究價值,有良好的研究基礎和成果積累,且對研究計劃總體目标有較大貢獻的申請項目,将以“重點支援項目”的方式予以資助(約為300萬元/項);對實作研究計劃總體目标有決定作用的研究方向,将以更大支援強度的“內建項目”方式予以資助(約為1000萬元—1600萬元/項)。根據項目執行的年度進展情況或考察結果,本重大研究計劃将适度調整獲準項目的資助經費(中止課題或追加經費)。

指導專家組成員 組 長鄭南甯 院 士 機器視覺模式識别西安交通大學

副組長 李德毅 院 士 資料了解 總參61所

副組長 陳 霖 院 士 認知科學視覺感覺 中科院生物實體所

成 員 常謙順 研究員 方程計算圖像處理 中科院數學與系統研究院

成 員 孫富春 教 授 智能控制機器人 清華大學

成 員 胡德文 教 授 模式識别腦機接口 國防科技大學

成 員 楊靜宇 教 授 機器視覺圖像處理 南京理工大學

成 員 宗成慶 研究員 自然語言處理語音識别 中科院自動化所

秘 書 辛景民 教 授 模式識别信号處理 西安交通大學

Shihao Ji

http://people.ee.duke.edu/~shji/ 杜克大學的博士,大學和碩士在西電讀的,不知道該不該稱其為大牛,因為他以第一作者發了兩篇PAMI。 作者目前主要在研究Bayesian Compressive Sensing. 相關的有三篇文章: 1。Bayesian compressive sensing and projection optimization。2007. [pdf file] 2。Bayesian compressive sensing。2008. [pdf file | code] 3。Multi-task compressive sensing。2009. [pdf file | code] 另外,從作者的首頁可以連結到Bayesian Compressive Sensing 的首頁,有很多相關的工作,及代碼,感興趣的可以檢視:http://people.ee.duke.edu/~lihan/cs/

作者在杜克的導師Lawrence Carin,http://people.ee.duke.edu/~lcarin/ 看看他們的研究組吧,有用的連結: Electronic Copies of Recent Papers

Reading Group

AFRL-Duke Workshop on Compressive Sensing

雖然看了相關的貝葉斯的基礎知識,但是看起來BCS的文章,還是沒搞明白,從理論上講,BCS應該屬于機器學習的内容,杜克的這個研究組似乎也主要沿着貝葉斯這條線在做,繼續關注。。。。

繼續閱讀