天天看點

微軟研究院近兩年七大重要開源項目盤點

2016年9月github報告顯示,微軟擁有16419位開源貢獻者,排名第一。微軟的貢獻使得開源界的力量更為壯大。對開發者個人而言,更多的開源項目也将幫助他們節省大量造輪子的時間,進而專注于性能表現與使用者體驗的優化。

如何利用好微軟提供的這些開源工具包資源呢?這篇合集介紹了微軟研究院過去兩年的幾個重要開源項目,如深度學習領域的微軟認知工具包(原名cntk)等。大家隻需點選每個項目後所附的連結就可以輕松通路。

微軟研究院近期開源工具包一覽

微軟認知工具包(microsoft cognitive toolkit)

微軟研究院近兩年七大重要開源項目盤點

微軟認知工具包(原名 cntk ) 是微軟出品的開源深度學習工具包。新版的微軟認知工具包在原有 cntk 的基礎上增加了對 python 的支援,同時在性能方面也有所提高。而經實驗室測試表明,微軟認知工具包的性能在同等主流工具中表現突出。其裝置要求相對靈活,同時支援 cpu 和 gpu 模式。是以沒有 gpu ,或者神經網絡比較小的實驗,可以直接使用 cpu 版的微軟認知工具包。微軟認知工具包将神經網絡描述成一個有向圖的結構,葉子節點代表輸入或者網絡參數,其他節點計算步驟,它同時支援卷積神經網絡和遞歸神經網絡。

lightgbm

微軟研究院近兩年七大重要開源項目盤點

由微軟亞洲研究院dmtk(分布式機器學習工具包)團隊在在 github 上開源了性能超越其他 boosting 工具的 lightgbm,在三天之内 github 上被 star 了1000+次,fork了200+次。lightgbm (light gradient boosting machine)是一個實作 gbdt 算法的架構,支援高效率的并行訓練,它的主要優勢表現在訓練方面的高效性、較低的記憶體占用、更高的準确率、進行并行學習與大規模資料處理的能力。公開資料表明 lightgbm 相較于同類工具,其學習效率和準确性都表現突出。此外,實驗也表明 lightgbm 通過使用多台機器進行特定設定的訓練能取得線性加速。

3.project malmo

微軟研究院近兩年七大重要開源項目盤點

微軟研究院曾在不久前示範過用遊戲《我的世界》來訓練人工智能的實驗性項目。現在這款項目project malmo通過 github 正式開源。研究者可以通過《我的世界》測試人工智能算法,指導人工智能學習并完成一些複雜任務。這一計劃可以通過遊戲中的人完成現實生活中的計劃任務。當微軟研究員團隊在利用這個工具訓練人工智能的角色學習如何爬到虛拟世界的最高點時,這些角色使用的是與人類學習新任務時相同類型的資源。也就是說,這個由科學家研究的小人與普通的人類玩家并無差別,是真正的以人為基礎進行的仿真。這樣的仿真使研究者完全不需要開發人工智能實體,是以也不再要求研究者有機器人方面的開發背景,就可以進行一些原來隻能靠機器人或通過極高成本才能進行的工作。

sdn

微軟研究院近兩年七大重要開源項目盤點

分布式伺服器中的多台伺服器該如何連接配接?連接配接之後又該如何確定資料傳送效率和實時支撐呢?sdn(software defined network)由此應運而生,它颠覆了傳統網絡搭建的邏輯,采用虛拟化技術,根據應用資料的不同使用方式,動态調整和配置設定資源,優化資料的存貯和轉移。據此,sdn 技術可以為不同的使用者群建立不同的虛拟網絡,實作不同的資源配置,進而使得實體網絡的能力被更加合理的利用。微軟現已開發 sdn 工具幫助開發者快速部署起一套 sdn 平台。

sora

微軟研究院近兩年七大重要開源項目盤點

微軟亞洲研究院開源的軟體無線電項目 sora 是一個完全可程式設計的高性能軟體無線電系統,能夠快捷而有效地實作目前最前沿的無線通信技術。軟硬體平台的創新使 sora 在 pc 上就可以完成高性能的無線信号處理。自2009年首次發表以來,sora 已在學術界獲得多項最佳論文和示範大獎。目前已有50多家大學和科研機構在教學和科研中使用 sora 。為滿足研究者們日益迫切的研究需求,完全開源的 sora 系統提供了大量特性,其中包括:支援定制的射頻前端,rcb 和通信模式。

graphview

微軟研究院近兩年七大重要開源項目盤點

2015年12月16日,微軟亞洲研究院系統算法組開發的圖資料庫 graphview 開源。graphview 是一款中間件軟體,友善使用者使用關系資料庫 sql server 或 azure sql database 高效地管理和處理大規模圖資料。graphview 在實體資料表達以及系統運作行為上和原生圖資料庫完全一緻,填補了關系資料庫和圖資料庫之間的鴻溝。它還繼承了關系資料庫領域數十年的科研成果,可以提供市面上原生圖資料庫難以媲美的性能。graphview 的功能包括:完備的查詢語言,索引,事物處理和系統管理等等。

graph engine

微軟研究院近兩年七大重要開源項目盤點

2015年5月20日,微軟亞洲研究院 graph engine 1.0預覽版正式釋出。graph engine 是一個基于記憶體的分布式大規模圖資料處理引擎,能夠幫助使用者更友善地建構實時查詢應用和高吞吐量離線分析平台。graph engine 在學術界有個更廣為人之的名稱,叫做 trinity。此外,graph engine 還可與強大的內建開發環境 visual studio 以及微軟雲計算平台 azure 無縫內建。無論本地開發還是雲端部署,graph engine 都可以給開發者帶來極佳的使用者體驗。