天天看點

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

華為在人工智能相關領域的發展路徑選擇,也許将直接改變中國 ai+ 時代的産業格局和江湖面貌。對于這句話,有些人能迅速心領神會。

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

過去幾年,ai 已經成為華為的重中之重。新智元在和安卓綠色聯盟、中科院自動化所合辦的 6 月百人會閉門論壇上,特别邀請到華為 cbg 軟體工程部 vp、終端智慧工程部部長張寶峰做了專門的講解。張寶峰 1998 年加入華為,在資訊科技領域有超過 18 年的工作經驗,目前負責華為終端 ai 軟體的開發和傳遞。他說:“對于手機終端智慧化的未來,我談談我的認知和了解,大家可以看看,哪些東西是對的,哪些是錯的。”也許,他的認知和了解,正是了解終端智慧化産業方向的一把鑰匙。

張寶峰履歷:

張寶峰,華為 cbg 軟體工程部 vp,終端智慧工程部部長,負責終端ai軟體的開發和傳遞。曾擔任華為諾亞方舟實驗室副主任,負責資料科學領域的中長期技術研究工作,研究方向為資料挖掘、機器學習和人工智能。中國核高基專家組成員和中國 ccf 大資料專家委員會成員。

張寶峰 1998 年加入華為,在資訊科技領域有超18年的工作經驗,有豐富的國際/國家标準組織活動經驗,曾任國際電信聯盟13研究組固定移動融合課題的報告人,中國通信标準化協會網絡與交換技術工作委員會副組長。

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

回溯人類發展的變化曆程,是一個越來越加速的過程。一百萬年前還是茹毛飲血時代的人,到了距今一千年前的農耕時代,見到了農耕生活的烤肉;一千年前農耕時代人去到兩百年前,或是那時的人來到現在,看到天上的飛機、使用的手機終端,他們能感受到什麼?

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

這代表了一個非常有意思的“吓尿指數”,未來學家庫茲韋爾強調人類曆史發展的加速度。如果生活在若幹年前的人被帶到今天的話,将被現在所謂的科技生活、交通現狀、社會本身的現狀所震驚。在幾千年、幾百年的社會發展中,科技進步扮演着非常重要的角色。談到今天的時代,毫無疑問是人工智能。”

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

自從計算機在象棋、圍棋方面打敗人類之後,就再沒被擊敗過。這次柯潔輸了之後,估計大家沒有太大興趣再跟機器比誰強誰弱。這個曲線還再繼續加速,加速過程中,我們認為未來很可能會超出我們自己的想象。

技術本身是一個虛拟的概念,真正實作變革的是産品,是終端形态的變化。未來終端到底會以什麼樣的形式互動?我們的技術在其中扮演着什麼角色?

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

手機終端的變革,從最開始的模拟信号,隻支援打電話功能,發展到了數字化的資訊擷取時,手機已經可以代替電腦。而未來會是數字助理,如何給使用者真正最佳比對,找到他自己想要的東西?資訊能夠更高效、更便捷地驅動手機使用者從智能助理得到服務,這是我們真正追求的。

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線,如何真正産生更自然的互動?我們用手機的時候,從以前的按鍵,到今天的觸屏,到現在的語音,一代一代進展。如何用現代的人工智能技術實作“可用”?比如喚醒,這個功能本身很容易,現在有幾種智能音箱都要馬上上市。但喚醒又很難做。安靜環境下,可以非常容易實作比較高的準确率。而到嘈雜環境的時候,比如正在播放音樂,或者有很多人聊天,這時正常喚醒,并且識别是你,就是一個很難的挑戰。這是一個新的時代。ai 給終端帶來的最大價值在于入口本身越來越精準,越來越人性,也就是越來越便利。

手機是一個現代 it 技術集大成的裝置,裡面有大量的傳感和互動資訊,如語音、文字、視訊、傳感器,它能帶來的一個很大的變化,使現實世界更容易更友善地變成數字化,并且由于手機現在已經毫無疑問成為伴随人每天工作生活時間最長的 it 裝置,它一定會産生非常重要的橋梁作用。

對于手機終端智慧化的未來,我談談我的認知和了解,大家可以看看,哪些東西是對的,哪些是錯的。

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

第一,了解使用者。大量的傳感裝置或者智能互動裝置出現了,包括以前的眼鏡、現在的手環,還有手表、手機,這些終端圍繞某一個使用者,已經在大量刻畫所有的生活軌迹。圍繞每個使用者,有很多種終端同時為你工作的時候,需要真正懂你的代理,幫你代理終端本身的控制和互動。未來的終端裡面,終端泛化需要真正懂你的助理。虛拟世界裡面強調的是真正對“你”的了解和認知。未來 ai 往前發展,特别是對于消費者裝置來說,這是第一個非常基礎的需求:如何真正懂你,并且實作多端協同控制。

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

第二,變被動為主動。現在業務服務都是以 app 的方式提供給大家,這是标準的智能手機的商業模式。但終端現狀存在一些問題,比如一個使用者手機平均裝了一百個app,任何一個功能,都有好幾個app能完成。打車有好幾個app,新聞閱讀有好多個app,但是每個app,都還有一些小衆化的需求是需要的。未來的智能助手,建立在使用者認知基礎上,替使用者完成初步篩選,便利的主動推送,真正主動探知使用者的需求,讓使用者一步完成想幹的事。這是我們看到的第二個趨勢,主動服務。

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

第三,智能終端的終生學習。終生學習并不是從使用者接入開始到使用者離開你的服務為止。類似人類從小孩到中年到老年,整個過程都能感覺和認知,智能終端能不能在整個事件的生命周期内持續提供服務?比如從深圳來北京的一趟飛機,航班資訊非常多,能不能決定一下選哪個?萬一有一些意外,能不能提供一個備選方案?包括出行,包括酒店,包括航班,一系列資訊其實都是連續的,行程任務很明确,所有的一切是不是能夠替我在周期内完成?ai 整個能力部署之後,建立整個學習引擎之後,應該能夠提供一個場景化選擇适配的能力,能夠知道我的使用者的場景變化,以最佳的方式來完成我的任務,這裡面是持續性的學習過程,不是單次的适應過程。但是本身來講它是巨大的挑戰,如果從完整事件的高度看,這需要聚合各式各樣的 ai 能力拼成完整的系統,而這個系統本身的駐留産生終生學習的效果。通過成功完成每次任務,通過各式各樣人的群體測試的疊加,它就會越來越智能。這個智能系統才是可持續發展的系統,不是單次型的智能系統,部署完、訓練完就完了。這是從消費者解決方案的角度來看,ai 領域能夠帶來的非常大的變革性的場景化的需求。

以上三點是比較值得和大家分享的潮流和趨勢,下面,我将提出來一些痛點,與行業内的專家們交流。

第一是端側智能,加盟 cbg (華為消費者 bg)之前,我夢想有一個超級強大的雲,一個在雲端持續處理的超級強大的大腦。但是我們去年釋出 magic 手機的時候,有一個客戶跟我提,用你們的手機正看着一個視訊,突然跳出來一個推薦,說蘇甯上賣的某個東西比京東上便宜 10 塊錢,這是系統不停在分析使用者本身的業務需求,客戶建議說,你們要控制一下這個。

另外,像輸入法這種模型,如果在手機上敲的每個字都要回到雲端,從這個角度去想,其實個人感受還是非常不舒适的,不知道未來的人是不是能夠适應這樣的東西。現階段社會裡面還是有非常多的人比較敏感,他也許會想,我現在敲的每個字都在雲端了,不知道你會怎麼去用,我互動的一切你都獲得了,我很擔心。

這裡有一個很重要的問題,遲延。今天上傳 1028×760 的照片,至少要秒級的時間上傳到雲端,加上分析的時間,一個來回需要1點幾秒甚至2秒以上,這樣的體驗在使用者很多場景下是不可接受的。我當時來到 cbg ,感覺到很大的問題是,不管雲側做得多麼準,從體驗看過去,消費者真正接收到的其實是速度很慢的、且互動體驗還存在很大風險的服務提供模式。”

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

從今年的産業變化看,各大廠商也意識到了消費者這層心理問題。google 的大會釋出了 tensorflow lite。如果放到端側去,端側是否能相容 tensorflow 的引擎和平台,讓模型本身的東西在本地執行,現在還沒有到模型的訓練階段。

華為已經在嘗試能不能在本地進行簡單模型的增強訓練,或者簡單模型的生成問題。facebook 提出的 caffe 2 是一模一樣的故事,一樣是關于如何能夠真正在端側有一個通路的引擎平台,使大家更友善去運轉自己的人工智能複雜模型的問題。

在嘗試端側的過程中,我們遇到的第一個問題是,如何在端側以使用者可以接受成本的情況下,真正執行我們自己的智能體驗,真正在端側智能提供有效簡化和資訊擷取便利的技術,這在所有的 ai 智能互動部分都會有挑戰。

為了解決這個問題,我們在今年也會嘗試做一款可以支撐人工智能模型在端側執行效率的晶片。

端側智能并不絕對代表雲側沒有事幹,終生學習、感覺、認知,其實很多是離不開雲的。但端側智能有客觀需求,從使用者角度還有做産品的角度都有客觀需求。這是今年遇到的挑戰和值得嘗試的方向。

第二,現階段衡量人工智能水準非常重要的名額是語音識别,還有圖像分類。這兩點,大家都鼓吹已經超越人類,但是我們真正在産品線實測的結果還不成熟。

比如有些微信裡面往往設計非常花的背景,字型設計五彩斑斓,這種情況下使用 ocr 技術實作真正通用的自然識别準确率,估計是所有的研究團隊已經不再做的方向,但這是真正的實際名額。而語音識别在現實中有噪音的識别率是很低的。大家都在宣傳人工智能已經成熟,已經超過人類,實際在真正應用場景裡面差距蠻大。這是給大家提出一個期望和希望,即能不能真正變成實用、可用的。

别光說理想環境裡面某個名額測上去達到百分之九十六、百分之九十七,甚至還在追求百分之九十七點幾的精度。能不能真正泛化起來把環境場景做複雜一點,不要做太大的限制,而是變得真正可用。

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

前面兩個名額都是跟端側有一定的相關性。一周前,我們項目組在讨論一個非常簡單的圖像分類任務。960 × 960 的圖檔在端側做分類不是很複雜的時候有 800 毫秒的時延,對人來說,操作時有感覺,相當于點了之後,頓了一下才會有互動的感覺。

在相機裡面疊加一個計算機視覺功能的時候,我們遇到的問題是,多了 200 毫安。大家可能對這個機關不是很有感覺,手機裡面如果一個任務超過 1 安培,手機其實是非常容易着火燒起來的。單任務超過 1 安培很危險,2 安培幹掉 1/5 的上限。人工智能在計算機視覺裡面啟動人臉識别、性别識别,一系列任務都搞的話,能源的消耗也是不可接受的。我們希望在實作一個任務時,任何一個機關時延都在百毫秒以下、40 毫安以下。這也是專用手機 ai 晶片追求的技術名額。

我們其實是有限制的,ai 并不是模型越複雜越好,而是在一定情況下,一定考慮成本。我來了産品線之後,真正非常非常重視的是,在雲端不是不能跑,而是跑了用不起來,那麼做這個技術有什麼用?在做今年的整個産品傳遞時,我面臨着很大的壓力,正好借這個機會跟大家分享一下。實實在在的名額是可以牽引着人們繼續往下一代走,技術上可行了,就需要再多考慮一步,需要在面臨場景的複雜度和工程限制時也能做到。這樣,我們才認為這個 ai 技術能真正走到産業裡來,确實解決了使用者痛點的問題。

第三點,深度學習。昨天看微軟的劉鐵岩在知乎上寫了很長的貼子講,人工智能到了哪兒?他提出一個很好玩的概念:調參黑科技。

AI 吓尿指數與終端智慧化未來的三大痛點AI 已成為主驅動力之一——“吓尿”周期變短,影響範圍變大智慧革命和互動革命是未來驅動整個手機産業改變的兩大主線 手機終端智慧化的未來——三大需求:了解使用者,主動服務,終生學習 終端智慧化的痛點:端側智能,産品線實測,深度學習

現在面試很多學生時,會問他做了什麼,用深度學習模型做了多少層的網絡,做了多寬的參數選擇,用了哪些比較流行的各種各樣的層,有點像堆積木。

我不否認這代技術很有用,深度學習客觀來講解決了很多功能上很難解決的問題,包括語音識别還有圖像分類。但是這些東西是不是夠?既然作為 ai 領域裡面研究的先鋒或者所謂先行者的話,大家還要考慮一下這個東西夠還是不夠的問題。

理論上來講,深度學習的模型确實應該有最強的分析能力,但是深度學習是不是代表着隻停留在這樣的應用就夠了?從産業應用角度,我們确實沒有時間去打開看每一層裡面有沒有優化的空間,以及引入新的人腦科學的東西來去改進所有層的設計。光去搞調參黑科技是不太夠的。基于大資料提取出來的問題,沒有當時的特定情況,或者沒有高頻次反應,在現在的訓練模型裡面很容易把這種資訊忽略掉,這意味着理論上來講有一種 case 肯定會失效,意味着人工智能很多決策系統裡面存在不可承受的風險。如何解決在最不可預測情況下保證模型不出災難性後果的問題,這是非常值得鼓勵的研究。

此外,不排除在工程實踐裡面繼續做寬度、深度、廣度、變換去解決實際問題,搞調參解決實際問題。如果有時間真正去攻關的話,這類技術的極限在哪裡?是不是在産業化應用裡面更好?模型可解釋性,無外乎三種:樹狀、回歸、網狀。其實數量模型做完非常容易解釋,例如:針對 30 歲的男性應該推薦某個商品,隻要做出這個數量模型告訴大家為什麼當時做了這個決策以及給了這個推薦就可以了。網絡模型沒有一個人能講清楚到底為什麼,反正能用,效果好壞能測出來,為什麼從來不知道,這是這代技術的挑戰和壓力。我們非常希望得到可解釋性的東西,包括有了 attention 之後,我們做非常複雜的網絡意味着剛才提到的功率、記憶體所有的壓力都不太現實。如果我們能夠真正去了解這個模型,就可以做選擇、做壓縮,做裁剪。大家還是想想,既然做這種方向的研究,一定真正深下去、廣下去。

<b></b>

繼續閱讀