結合手寫與語音的漢字輸入
對漢字輸入來說,清晰的手寫方式可以相當準确,但速度受到限制;而語音輸入雖然速度較快,但準确程度有待提高。鑒于這兩種方式可以取長補短,微軟亞洲研究院語音組開發了兩者結合的輸入方式。我們将語音的識别結果和手寫的識别結果在後驗機率意義下相融合,進而提高了輸入的速度和準确率。
·雙語語音識别
在國際合作越來越廣泛的今天,許多人的電話本裡既有中國人,也有外國人。基于微軟亞洲研究院的無縫雙語識别引擎,我們開發了應用于掌上裝置的語音撥号軟體。該軟體可用英語或漢語呼叫聯系人,具有可靠的識别性能。另外,我們還提供了能自動對不在目錄中的呼叫進行拒識的功能。
·基于手機的移動計算
利用最新的無線網絡技術,微軟亞洲研究院無線與網絡組開發了一系列應用原型系統,幫助使用者使用手機随時随地通路和控制他們計算機上的資料和應用程式。通過手機,使用者可以:
·遠端浏覽和操縱檔案
·擷取和控制遠端計算機上的電子郵件
·控制幻燈片的示範
·控制媒體中心計算機
·完成遠端桌面搜尋
·進行遠端監控
·閃光摳圖
摳圖是一種廣泛使用的圖像合成技術,主要應用于專業的平面設計和普通使用者數字圖像處理等領域。微軟亞洲研究院的閃光摳圖技術是指利用一對閃光/不閃光圖像抽取前景圖像。改技術利用了一個非常簡單的原理:如果背景距一對閃光/不閃光圖像比較遠,則隻有前景物體被閃光燈改變亮度。基于這個原理,我們提出聯合貝葉斯閃光摳圖技術,能夠非常有效的從一對閃光/不閃光圖像中抽取前景圖像,甚至在前景與背景非常相似或背景非常複雜的情況下仍可有效進行抽取。閃光摳圖技術可以幫助使用者即便使用普通數位相和閃光燈,也可以非常容易的完成室内/室外的摳圖任務。
·網格環境下基于Windows Mobile的移動導航服務系統
該系統由同濟大學與微軟亞洲研究院聯合開發。面對目前智能交通和移動導航巨大的市場需求,其意義在于依托網格計算技術的支撐,依賴傳感器網絡、自組織網絡、寬帶無線通訊技術、多媒體技術等尖端科技,實作Windows Mobile系統上面向手持和車載使用者的移動導航系統。
該項目依托上海市交通資訊網格,利用網格計算技術,為資訊服務提供技術支撐。項目中建立的基于Ad Hoc技術的車輛網絡,突破了傳統的導航系統,隻通過資訊中心擷取資訊的集中控制方式,網絡中的任意一個節點均可互通。例如:某地發生交通事故,某地交通擁堵等駕駛員觀察到的交通資訊,可以實時通過網絡共享。此外,在終端裝置上,除具備經典的定位導航功能外,其還內建了行動電話、音視訊播放、網絡浏覽等衆多附加功能。而在人機互動方面,則采用了全語音的播報方式。
·繪制現實
繪制草圖是建築師在概念設計階段最自然和最常用的方法,但是目前的絕大多數計算機輔助設計系統無法處理以草圖方式的輸入資料。而微軟亞洲研究院所開發的一個全新的概念和方法叫做“繪制現實”。該方法可以處理以草圖方式的輸入資料,并産生真實感的效果,即通過直接處理輸入建築師手繪的草圖來産生具有照片真實感的結果。整個系統分為三個部分,即:草圖輸入、幾何重建、以及互動繪制真實感效果。
·桌面照片搜尋管理
使用MSN桌面搜尋,使用者可以像網絡搜尋一樣容易地查找到他們計算機上的任何檔案,包括電子郵件、約會日程、照片、文檔等。然而,被桌面搜尋所索引的照片目前還隻能通過檔案名、目錄名以及手工标注來進行搜尋。為了支援更先進的照片檢索,我們在MSN桌面搜尋中內建了諸多基于内容的分析技術,包括照片/圖形分類、室内室外分類、城市風景分類、圖像品質評估以及人臉檢測等。通過自動被關聯到照片上的關鍵詞,使用者可以更容易、更快捷地搜尋到他們計算機上的照片。
·Libra 學術搜尋
Libra 學術搜尋引擎是用來更加智能的擷取在計算機科學領域内的各種關于論文、科學家、 會議、 期刊和學術興趣圈的資訊。與傳統的頁面級搜尋引擎相比,Libra使得對象級别的資訊查詢成為可能。它可以幫你:
·找到一個學術領域内的頂尖科學家、會議和期刊;
·了解一個學術興趣圈的興起與發展;
·更準确地找到你感興趣的論文;
·發現正在崛起的學術新星和時下熱點的論文
·服務台
Information Desk是關于企業内部網搜尋的一個研究原型系統,它由微軟亞洲研究院和微軟SharePoint Search組共同開發,現在試運作在微軟公司内部網MSWeb上。Information Desk能自動從網站中的檔案中抽取領域資訊和檔案中繼資料。領域資訊包括定義、縮寫和首頁,檔案中繼資料則包括标題、作者以及關鍵詞,而适用的檔案格式包括Word 、PowerPoint、HTML。Information Desk能有效利用抽取的資訊幫助SharePoint使用者搜尋企業内部網資訊, 進而為使用者提供更好的服務。比如:“Information Desk能解答諸如“這個術語是什麼意思?”,“這個産品組首頁在哪?”,以及“誰了解這項技術?”之類的問題。目前以MSWeb作實驗,已經索引了6,000,000以上的檔案。這些技術以統計學習技術為基礎,進而能夠比較容易地應用到其它領域。
·色彩草圖
如何把一幅使用者給定的照片轉換成為一張具有手繪風格的藝術作品是一個非常有趣和極具挑戰性的問題。微軟亞洲研究院的Color Sketching即計算機繪畫系統,則可以實作将一張使用者給定的照片轉換成具有特定手繪風格的作品。為了做到這一點,我們需要對圖像的每個區域的形狀和顔色進行風格化處理:首先是把圖像分割成不同的彩色區域。然後在此基礎上提出了一個兩步算法——在第一步,我們運用一個基于亮度計算的方法來收縮每個彩色區域的邊界線,以分别突出鮮亮和陰影地帶,這使得圖檔整體效果更具有手繪草圖藝術的風格;第二步,使用色彩轉移算法來強調主體的内容并自動獲得視覺上令人舒适的色彩組合。
·水墨動畫在遊戲中的應用
該課題由北京電影學院與微軟亞洲研究院聯合開發,力求在中國水墨畫和電子遊戲之間找到一個結合點,将水墨繪畫的風格應用到現代娛樂中。我們緻力于把中國傳統的文化和視覺形式與現代的娛樂精神結合在一起。這是數字和水墨的融合,也是現代技術與中國傳統文化的交融。該課題在電腦遊戲中應用的研究,将給遊戲制作者提供一套完整的制作流程,促使相關的遊戲畫面制作技術,比如模組化、渲染等更加成熟并走向突破。其研究涉及到下列議題:
·中國傳統水墨動畫的藝術特色及其和遊戲動畫的結合點;
·中國傳統水墨動畫的藝術特色及其和遊戲動畫的結合點;
·水墨動畫對場景設計和角色設計的影響;
·水墨動畫對互動性的影響;
·在遊戲動畫中運用水墨風格所需解決的相關技術問題。
·虛拟奧運博物館
虛拟奧運博物館是北京08年29屆奧運會的建設項目,由北京航空航天大學與微軟亞洲研究院聯合開發。它基于Internet展示,集科技、娛樂、教育于一體。其目标是建立世界上第一個在多文化背景之下介紹奧林匹克運動會的曆史及發展的虛拟博物館。其中:
虛拟跳遠系統是博物館中對古希臘奧運會跳遠項目的三維複原與重制。我們采用運動捕獲技術來擷取真實的人體運動資料,并針對運動資料的重用與合成開展了研究。通過制作運動編輯工具,實作運動資料的重用與合成,使得同一運動資料可以應用到不同三維角色,并可以在不同的運動資料片斷之間平滑過渡。基于這些技術我們制作了一個虛拟跳遠系統,實作了人機互動。
跪射秦俑展示系統:為展現中國的古代體育,我們使用三維掃描器擷取了彩色跪射秦俑文物模型的三維資料。通過對多角度掃描擷取多個資料塊的自動拼接、模型自遮擋産生模型漏洞的修複,以及高分辨率紋理自動映射等問題的研究,最終實作了一個彩色跪射秦俑三維模型的展示系統。
·植物葉子的實時渲染
真實感的葉子渲染需要模拟葉面的複雜模型和精确的光照計算,因而該課題一直是計算機圖形學的一大難題,在有實時需求的情況下該問題顯得尤其困難。微軟亞洲研究院的Real-Time Rendering of Plant Leaves技術提供了一個渲染體系進而解決了這一難題。該技術可以在全局光照的情況下實時渲染葉子。具體而言:
對葉子的表面特性,我們提出了一種參數化的模型,以及空間可變的雙向散射和透射函數(BRDF/BTDF)。這些函數分析了葉子的外表面和内表面的光照特性,而且可以從真實的葉子中測量得到。更重要的是,這種光照特性的表達十分緊湊,而且可以用圖形硬體來實作實時的加速渲染,達到很高的渲染速度。
對于全局光照,我們擴充了預計算的光輻射傳播方法(PRT)來渲染全頻率的光照效果。我們把光照分解為低頻的環境光和高頻的太陽光兩個部分。太陽光最終被分解為直接光照和非直接光照兩部分。非直接光照我們用PRT實作,對直接的光照部分,我們提出了一種新的預計算的光可見性卷積方法(LVC)實作。