2018年,小米釋出了第一款AI手機。
去年,雷軍靠着對供應鍊改造和内部管理實作手機銷量“逆襲”,之後逐漸将重心轉移到AI技術和應用的研發上來,AI也逐漸上升為小米未來的核心戰略。不過,相比“All in AI”、“AI in All”以及“AI First”等口号,小米的AI之路相當低調。
這種低調一方面是因為小米是一家更注重産品落地的公司 ,另一方面是因為實作AI+IoT是一項龐大的工程,需要系統性思考和布局。
小米從不缺少資料,小米在雲計算和大資料方面也有很深的積累。MIX 2S使用的晶片屬于高通的第三代AI平台,而手機、音箱等裝置也是AI場景應用的主要實作載體。這一切因素都齊全了,小米的AI之路該怎麼走?
近日,小米人工智能與雲平台副總裁崔寶秋出席了2018新智元産業躍遷AI技術峰會,全面剖析小米的CBA(Cloud Computing、Big Data、Artificial Intelligence)技術主線。

C:Mi Cloud、融合雲、生态雲,建構小米生态
2012年,小米全年的手機銷量破紀錄的達到719萬部,大量的照片及視訊對資料存儲提出了要求。
也就是那年的年初,崔寶秋被雷軍說服從美國歸來加入小米,負責小米的網際網路背景技術架構和雲平台建設。幾乎是從零開始,崔寶秋開始組建小米雲平台團隊。小米雲平台主要是一個技術平台部門,但它也負責一款産品,也就是小米雲。“小米雲不是一個公有雲服務提供商,不對外提供服務,這是差別于阿裡雲、金山雲等最重要的特征。”崔寶秋說,目前小米雲有Mi Cloud(小米雲服務)、融合雲和生态雲三大闆塊内容。
Mi Cloud于2012年7月開始成立,是小米手機使用者的個人資料中心,對标蘋果iCloud,小米手機中的聯系人、通話記錄、便簽、照片、視訊等資訊都會同步到雲端。
在小米公司内部,很多業務團隊都有存儲和計算的需求,例如智能語音,計算機視覺,MIUI浏覽器,金融,音樂等等,同時很多工程師,例如研發,測試等等,也需要靈活的計算資源配置設定。為了更高效的滿足公司内部需求,小米建設了小米融合雲,用私有雲形态為公司内部各個團隊提供雲服務,同時也支撐着公司的大資料挖掘和分析。
小米在智能硬體領域投資了很多家生态鍊企業,2014年,小米開始建設小米生态雲,目的是為衆多小米生态鍊企業以及合作夥伴企業提供一站式的雲服務和解決方案,用雲服務的形式打造小米的大資料生态和人工智能生态。
B:資料科學在腦海裡根深蒂固,小米有天生的優勢
在加入小米之前,崔寶秋曾就職于雅虎和 LinkedIn,這兩段工作經驗,讓大資料和資料科學概念在他的腦海裡根深蒂固。
當時在中國講資料科學曾遇到一些尴尬,網際網路行業中,真正了解資料科學的人不多,優秀的資料科學家更是稀缺。在崔寶秋看來,小米不僅僅是一個手機公司、更是一個移動網際網路公司,一個新零售公司,最重要的是一個大資料公司,這也是他認為小米能夠在移動網際網路時代崛起的重要原因。
基于大量的手機和IoT裝置,小米天生具備擷取大資料的能力,有了資料,就有了訓練模型的基礎材料。
A:AI是小米未來十年的核心戰略
如果潮流來了,一個公司沒有準備和積累,那麼它就會錯過機會。
人工智能在四、五年前逐漸興起來的時候,小米雖然有一些自然語言處理、大資料分析和機器學習的積累,但是深度學習在很多領域的應用是沒有布局的。
2014年,亞馬遜推出智能音箱,将語音互動技術應用在傳統音箱中,讓人們看到了人工智能應用的巨大場景;2016年,AlphaGo擊敗李世石,深度學習向世界展示了它的威力。“要感謝AlphaGo,讓我們看到了深度學習的潛力。”崔寶秋說。
到了2016年,小米立項做第一款戰略級AI産品——小米AI音箱。“當時我們幾乎什麼也沒有,AI音箱的大腦團隊是從大資料團隊、搜尋團隊抽調過去,到今天這個團隊就演變成小愛團隊。”崔寶秋說。
2017年,小米雲平台改名人工智能與雲平台。依靠小米之前的資料積累、雲計算積累,通過對機器學習和深度學習平台的搭建,小米抓住了AI的潮流并實作了技術落地。
截至到2018年1月,搭載“小愛同學”的智能裝置累計激活數已經超過1000萬,這也讓“小愛同學”成為小米最有價值的智能語音互動平台。在一次内部會議上,雷軍說,AI是小米未來十年的核心戰略。
“我們壓力很大,這是機遇和挑戰并存下的壓力。錯過這波機會就太可惜了,團隊如果沒有為小米抓住機會的話,我們就成了’罪人’。”目前,崔寶秋負責的人工智能與雲平台團隊共有800多人,其中AI團隊數量占一半左右。
以下是崔寶秋在峰會上的演講:
崔寶秋:非常感謝楊靜楊總的邀請, 很高興有機會跟大家交流,我今天分享的題目是“小米的人工智能之路”。
我在小米負責人工智能與雲平台團隊,這兩年在新的AI浪潮之中我感到非常興奮,因為20多年前我自己學的也是人工智能,但是當時我學的是邏輯程式設計,基于邏輯、推理、專家系統的人工智能技術。回頭看,那個時代是AI的寒冬,今天,AI迎來了另一個春天,這是非常讓人興奮的。小米在AI上做了哪些事情呢?今天跟大家分享一下。
好多人對小米的認知還停留在小米是一個手機公司,對小米做的事情不太了解。小米不僅是手機公司,更是移動網際網路公司、智能裝置公司、新零售公司,而真正了解小米模式的朋友知道,小米也是一家大資料公司,一家AI公司。
我在五、六年前加入小米,推動資料驅動,一年多前我把它更新為AI驅動。
在小米,我們從2012年開始在很多領域已經用到AI,隻不過當時大家沒有那麼深刻認識到深度學習這種新的AI技術的應用。在雅虎時代、Google時代,好多做人工智能的人都不屑于或者不願提人工智能。但是人工智能技術已經在小米或者在各個網際網路公司應用得幾乎無處不在,比如搜尋。過去很多年我一直做搜尋,AI的技術在小米十多款搜尋應用裡面很早就得以呈現,還有個性化推薦。小米有很多内容,如何做到千人千面,把最好的内容推送給最合适的使用者,也是人工智能可以發力的。
比如,我們團隊和小米電視團隊合作,推出了千人千面的拼圖牆,這個人工智能技術帶來了流量、帶來了使用者的增長。小米電視的開屏率、觀看時長都随之翻了幾倍。
今天我想講的是,2016年開始AlphaGo讓人們認識到新的人工智能技術,也就是深度學習的興起。我們為什麼從2016年開始要真正深度擁抱AI?今天的AI在小米意味着什麼?可能跟前幾年完全不一樣。
AI在小米将深度無處不在,兩大原因:
第一,小米有豐富的産品線。剛才香蕉出行示範的翻譯機就是小米生态鍊企業産品的一個代表,小米手機是現在人工智能技術的最大平台,圍繞手機,圍繞IoT,幾乎所有的産品都需要AI賦能。
第二,幾乎所有的AI技術,在各個垂直領域,都會在小米的産品線中得以施展,得以應用,這一點相信大家都同意。我給我的同僚們講,我們要在很多地方積累自己的力量,積累自己的技術與團隊,因為随時随地都有可能有新的需求産生。今天沒有的産品形态,下個月可能就有,今年沒有的可能明年就有。原來說的智能裝置之是以是智能,主要是因為它可以連到雲端,可以和手機互聯互通,但是我認為那些不是真正的智能,我們現在需要最好的AI技術,真正變得智能。
深度學習讓AI火了起來,大家都在談ABC(雲計算、大資料、人工智能),過去小米的技術路線發展圖實際上是從C到B到A的。我在很多地方都講過,深度學習後面有很強的大資料功勞,沒有大資料不能談深度學習,大資料背後需要有強大的雲服務、強大的算力。小米過去幾年打造了強大的雲技術團隊,從C開始到B,組建了小米的大資料團隊,招聘資料科學家,招聘這個團隊花了不少時間。2016年大力投入AI,圍繞深度學習打造小米AI團隊。AI今天已經成為小米的核心戰略,是未來10年20年最重要的戰略。
有些同行跟我講,你們小米隻是用AI而不是做AI吧 ?我說小米是做AI的。小米在AI上有三大優勢,不做AI實在可惜:
第一個優勢,我們有很強的硬體優勢,小米手機的設計制造能力代表了小米在硬體上的各種優勢和水準。小米AI音箱也充分顯示了我們的這個優勢。
第二個優勢,小米有很強的大資料擷取能力。
第三個優勢,小米的廣深的生态鍊布局,也就是産品線。很多人講,小米在AI上投入再多都不為多,這一點我非常認同。
這是小米的AI能力圖譜:從基礎的大資料、深度學習,到中間的感覺、認知層,再到上面的開放平台,對接小米的各個業務與産品,以及生态鍊的産品。
小米在AI上有了一定的技術積累,哪些技術在哪些産品上落了地呢?
首先看看視覺,視覺算法在一些産品上的應用,包括相機,人臉解鎖、美顔還有雲相冊。我們領先蘋果iCloud一年左右的時間推出了面孔相冊,算法團隊做出的魔法消除和智能補全,可以把你照片中不想要的内容去掉。
3月27日我們釋出了MIX 2S,帶來了我們的AI相機功能,場景識别今天可以識别25個大的種類,細分有206種之多。基于場景識别,比如會場内、室外、還是雪山等等,動物、植物,以及美食,在不同場景下需要用不同的設定,不是攝影高手很難做到完美,AI可以幫你近乎做到完美。再舉幾個例子,這幾張圖檔前天釋出會上雷總也講了,左邊是沒有處理的,右邊是AI相機做的,感覺很不一樣。還有多雲天氣左邊是什麼樣的,右邊是什麼樣的,AI場景模式截然不同。另外,我們的人臉解鎖,也即将在一些産品上落地。
AI單攝背景虛化,這是今年團隊做的我個人比較滿意的一個亮點。大家都知道現在各種廠家在硬體上投入很多,長焦、廣角、雙鏡頭等等,對背景虛化很有幫助。中國的女性使用者特别喜歡自拍,如何把自拍拍好,而前置的攝像頭基本都是一個鏡頭,怎麼做好?小米做出了自己的算法,在印度版和中國版紅米Note5上面釋出,印度的專業媒體發表一緻好評,超過很多知名品牌。我們與衆不同的地方,比如頭發絲還有衣服的毛領部位都處理得很好,細節處見精神,小米為此打磨了很久。
針對印度人群我們也做了一些優化,比如印度的男性朋友也特别喜歡自拍,對他們的胡須做一些特殊處理。還有印度婦女穿的很多民族服裝以及飾物,也做了特别優化。為什麼我們的算法在印度獲得一緻好評?離不開團隊在這方面做出的努力。
前天釋出會引起觀衆尖叫的一個功能就是手機上的”小愛同學”。很多人可能知道,今年我給團隊的一個目标,就是把“一句話的事兒“在手機上做到極緻。小愛同學是一個喚醒詞,去年釋出了小米AI音箱,大家稱它為小愛音箱。選AI音箱作為小米第一款AI戰略性産品是有原因的,因為音箱這款産品可以把團隊的積累,從大資料、搜尋、推薦、NLP、語音識别到合成、聲學、深度學習平台等等技術全部串起來。除了視覺以外,小愛同學或者小愛音箱促進了整個AI團隊的成長壯大。小米AI音箱一經釋出,受歡迎的程度超出預期,在京東上獲得了令人無法置信的百分之百的使用者好評。從使用者體驗和使用者好評度上看,雖然釋出的不是最早,但是小愛同學幾乎成了智能音箱的代名詞。前天我們釋出了小愛音箱mini版,每個家庭裡面每個卧室都可以放一個。
在小米手機上我們也内置了小愛同學,把原來小米手機的語音助手,類似蘋果的Siri,重新命名叫做小愛同學,可以做到熄屏喚醒。小愛同學背後積累了很多AI能力,先給大家放一段視訊看一下。
小愛同學的知識水準會越來越豐富,越來越可愛,越來越懂你,将來我們會深度打造小愛同學背後的一個小米虛拟助手。
小愛同學是一個智能語音互動平台,有很多種技能,每周會有更多的更新,大家可以期待。它現在可以控制很多智能裝置,是我們的一個戰略性産品。小米希望通過小愛同學控制所有的IoT裝置,也就是所謂的智聯網。目前小米的IoT平台有8500萬個線上的聯網裝置,小愛同學将來可控制的産品會越來越多。小愛同學促進了小米AI領域的全面提升,包括遠場增強、分布式拾音、喚醒等等。我們打造了國内首家全自動遠場聲學實驗室,同時也在牽頭、聯合行業中的多家公司、學術界、政府來推動小米的聲學标準。我們的ASR算法線上業務語音識别的字準确率非常驚人。15年前我在IBM工作的時候曾參與IBM語音識别測試,但數年後也未見語音産品落地。今年我們小米語音識别團隊用不到一年的時間達到這個數字,靠的是什麼?靠的是深度學習技術,靠的是後面豐富的語料。
小米的知識圖譜在快速發展,現在小愛同學背後的知識每個季度都在翻番往上漲,将來小愛同學隻會越來越聰明,智能問答團隊在為小米使用者提供各種知識擷取來源。
從雲計算到大資料到今天的AI,開源技術是我們一直擁抱的。在深度學習方面,基于TensorFlow、Kubernetes,我們一早就推出了小米自己的深度學習雲服務,從PaaS到SaaS,對小米内部各個業務開放,也對小米生态鍊企業開放。另外,我們準備開源小米自己的移動端深度學習架構,今天這個架構已經支援了CPU、DSP、GPU、高通和我們自己的澎湃晶片,支援TensorFlow和Caffe等模型,我們的目标是打造業内最好的移動端深度學習架構,Q2即将開源。
我們堅信智能手機是人工智能的最大平台,智能手機加上IoT将為AI帶來一個無限的生态。我們相信,利用AI的最新技術,我們可以更快實作小米的願景——讓每個人都能享受科技的樂趣。
原文釋出時間為:2018-04-4
本文作者:崔寶秋
本文來自雲栖社群合作夥伴新智元,了解相關資訊可以關注“AI_era”微信公衆号