天天看點

微軟亞洲研究院的30項創新技術詳解(2)

貼圖蒙太奇

紋理貼圖能夠極大提高3D模型的真實感和豐富它的表面細節,這種技術已經廣泛應用于電影和遊戲中。但是,将多張來自現實生活的圖檔貼到一個3D模型上,并且達到低的圖像視覺扭曲,一直以來都是一個非常痛苦且耗時的工作,這是因為整個過程完全依賴于數字藝術家的手工操作,生産效率非常低。為此,微軟亞洲研究院開發了“貼圖蒙太奇”技術,它以幾乎全自動的方式工作,能夠将多幅圖檔無縫的貼圖在任意複雜的3D模型上,整個過程隻需非常少量的人工互動,大大提高了生産效率。

·視覺仿真

做舊技術通過給虛拟場景添加歲月留下的痕迹,比如污漬、鏽迹、裂縫、劃痕來增強它的真實感。而微軟亞洲研究院所開發的是一種能夠很好模拟許多變舊現象的虛拟仿真技術,它通過在場景中跟蹤大量我們稱為γ粒子的特殊粒子來模拟物體變舊過程,這些粒子能夠在場景中傳播變舊資訊。利用這種技術,我們能構造與場景幾何相符的變舊效果,設計各種污染源——許多目前技術很難實作的效果都可以通過γ粒子跟蹤獲得,比如全局污漬滲透、複雜的多重變舊現象等;此外,γ粒子跟蹤技術不止能夠模拟表面的變舊現象,還能夠模拟歲月給物體帶來的幾何形變。

·新聞搜尋

為了更好的展示新聞搜尋的結果,微軟亞洲研究院設計了一個多媒體的新聞閱讀器。在該閱讀器中,新聞文字、地圖資訊、新聞圖檔以及背景音樂被有機的結合在一起,進而為使用者提供一個全新的閱讀新聞的體驗。

·搜尋結果的圖檔式摘要

傳統的網絡搜尋引擎往往忽略了網頁中很多的有用資訊,比如圖檔、Flash動畫等等;同樣,多媒體搜尋引擎則往往忽略了文字資訊,使使用者很難了解回報回來的搜尋結果。而微軟亞洲研究院的Image Snippet技術則徹底改變了這種搜尋體驗——通過對搜尋引擎的通路記錄分析,我們發現使用者的通路主要集中在網頁搜尋上,是以我們為網頁搜尋設計了一個新的界面,用以展示搜尋結果。我們從搜尋引擎傳回的網頁中,抽取出一些最有價值的圖像插入搜尋結果中,這樣的界面設計有效地利用了網頁中的非文字資訊,迄今已經受到測評使用者的普遍好評。

·圖像搜尋結果聚類

該圖像搜尋結果技術能夠實時地将某搜尋引擎的結果聚類。它彌補了傳統搜尋引擎将搜尋結果顯示成清單方式、進而難以浏覽的缺陷。而我們的技術将搜尋結果組織成層次的方式,使使用者能夠迅速确定所需要的結果的位置。

·搜尋結果聚類

搜尋結果聚類技術由微軟亞洲研究院網絡搜尋與挖掘組開發。它對搜尋引擎的查詢結果線上進行分組,并為這些分組選取合适的命名。該技術把傳統的搜尋結果表達方式變得更加易于浏覽。正常的聚類算法并不适合這個應用,因為搜尋引擎回報回的摘要比較短小,而且一般的聚類算法運算複雜度較高難以實作實時計算。我們開發的技術從另一方面解決了這個問題。我們的基本做法是首先找到典型的獨立主題,然後再把已有的搜尋結果按照一定規則配置設定到這些主題之下,進而實作階層化的浏覽界面。

·視訊搜尋

視訊搜尋正在成為網際網路搜尋領域備受關注的焦點之一,然而其局限性也日益突出:首先,目前的視訊搜尋引擎全部都是基于直接文本(包括相關網頁文本,視訊腳本,或語音識别等)索引,這些能夠直接擷取的文本資訊常常與真正的視訊内容大相徑庭;另一方面,由于視訊有時間性,簡單的視訊搜尋的結果清單不能有效幫助使用者快速了解這些視訊的内容,因而難以盡快找到想要的視訊;此外,包括視訊搜尋在内的線上視訊服務的商業模式仍不清晰,線上視訊廣告的相關性遠不令人滿意。

經過多年的研究,微軟亞洲研究院的視訊搜尋技術能夠:

1.更有效地為視訊建立索引;

2.更高效地組織和呈現視訊搜尋結果;

3.提供更智能的視訊廣告政策,并實作網際網路上高效的視訊編輯和共享。

·購物搜尋

今天,無數有價值的商品資訊散布在網際網路得各個角落,但使用者仍然很難從網際網路上有效獲得這些産品資訊和進行比較購物。通過多年的積累,微軟亞洲研究院建立了一個強大的工具集,包括分類、抽取、內建、排列等等,進而有效地從網際網路中發掘産品資訊,建立全新的商品搜尋引擎,使使用者通過Shopping Search能夠獲得輕松、便捷的購物體驗。

·僞均勻半透明材質的模組化與繪制

在真實世界中,大量的物體是半透明的并具有豐富的表面的細節,象面包,海綿,等等。這些物體在不同的光照條件下,呈現出複雜的光照效果。如何對這類材質模組化是計算機圖形學裡面一個具有挑戰性的問題。在這裡,我們展示了我們新近開發的一項技術,可以對這類材質進行有效的模組化,并從真實的物體樣本中獲得材質特性。進而使人們第一次可以在計算機上快速生成這類物體的真實圖像。

·卡通變形傳輸

變形技術是計算機動畫的關鍵性技術之一。許多好萊塢電影中的特效都依賴于變形算法實作。其中,把在一個二維或者三維物體上制作好的變形動畫應用到另外一個物體上,是計算機動畫中的熱點研究話題,它在電影工業中有很重要的應用價值。微軟亞洲研究院發明了一項微分域三維物體變形技術,能夠将卡通中的二維動畫重用到三維物體上。僅需簡單地在卡通的二維角色和三維物體之間定義幾條對應曲線,該項技術就能夠自動生成三維物體

·方言語音合成系統

語音合成技術已經在許多領域被廣泛的應用,最新的應用擴充到了娛樂領域。在新的應用領域:諸如可以說話的遊戲,電子書閱讀器,語音存儲管理服務或語音多媒體資訊業務等領域中,豐富的語音變化的的需要成為了語音合成系統的一個重要特征。絕大多數中文語音合成系統隻能說标準的國語,而我們這裡展示的語音合成系統将會說很多北方方言

·個性化的語音合成系統

一般的語音合成系統說話的方式很像播音員在朗讀新聞。然而,在某些應用場合,使用者并不滿足于這樣的聲音,他們希望計算機可以用聲情并茂的聲音向他們的孩子說故事,或者希望用他們本人的聲音給家人或朋友讀電子郵件。這就是個性化語音合成系統。微軟亞洲研究院語音組開發的語音合成系統木蘭(Mulan)将被預裝在下一代的微軟作業系統Windows Vista中。

·全分辨率視訊穩定

随着數字圖像的不斷普及,視訊信号增強技術變得越來越重要。而視訊穩定是最重要的增強技術之一,它消除了圖像不必要的抖動,并補償丢失資訊,産生一段新的高品質視訊。通常,手持錄影機拍攝的家庭視訊,由于不可避免的抖動,會産生不理想的視訊圖像。為了能夠更好的滿足家庭使用者的需求,微軟亞洲研究院開發了一種實用的視訊穩定技術,以産生高品質的全分辨率穩定視訊。

繼續閱讀