天天看點

人工智能的冰與火之歌:回顧2016,展望2017(餘凱)丨硬創公開課

編者按:本文内容來自地平線機器人創始人兼 ceo 餘凱博士在雷鋒網第 100 期硬創公開課的分享。

2016 年,人工智能在美好理想和殘酷現實的夾縫中野蠻生長。當從業者們認為,人工智能時代是“技術為王”的時代,但面對價格戰、商務戰、公關戰時,技術似乎不再是唯一的信仰。當從業者們認為,手握學術大牛、刷爆各種榜單就能所向披靡時,“ai 産品經理比科學家重要”、“刷榜是沒意義的”等反駁性觀點也越來越被業内認可。當從業者們認為,招一大批名校博士就可與巨頭比劃時,虛高的薪水和拿不出手的産品讓企業不得不開始考慮成本效益的問題。

雷鋒網第 100 期硬創公開課特邀餘凱博士為大家做了一期以《人工智能的冰與火之歌:回顧 2016,展望 2017》為主題的公開課,分享了他對今年 ai 現象的看法以及對未來的展望。

餘凱,地平線機器人創始人兼 ceo,前百度研究院執行院長,曾上司百度深度學習研究院( idl )、多媒體技術部(語音,圖像)、圖檔搜尋産品部等團隊。2012年以來,餘凱建立百度idl,發起和上司了百度大腦、百度自動駕駛等一系列項目,并連續三次榮獲公司最高榮譽——“百度最高獎”。餘凱發表的論文被引用超過 11000 次,獲 2013 年國際機器人學習大會( icml )最佳論文獎銀獎,曾任 icml 和 nips 領域主席。他于 2011 年在斯坦福大學計算機系客座主講人工智能課程,還曾率隊于 2010 年獲得首屆 imagenet 評測世界第一名。

人工智能的冰與火之歌:回顧2016,展望2017(餘凱)丨硬創公開課

1. 雷鋒網:2016 年 ai 圈最讓你記憶深刻的幾件大事 ?

ai 計算硬體:英偉達的股票在一年時間内從 100 億美金 500 億美金,震驚業界。背後的原因是處理器架構因為人工智能的需求正在被重新定義,google 也推出 tpu 來做 inference,除此之外,包括地平線機器人在内的不少公司正朝着這個方向去探索。

算法層面:如生成式對抗網絡等算法的突破性進展,使我們看到除了cnn、rnn、lstm,技術還在不斷推陳出新,讓這個行業變得越來越有意思。

開源平台:今年開源平台體系在不斷成熟,如 tensorflow、caffe 等,特别是由中國學生發起的mxnet成為亞馬遜 aws 官方訓練平台這件事,很了不起。

alphago 事件:改寫全社會從街頭百姓到政治對人工智能的認知,實作了大家均認為不能實作的事情。

人才流動:hinton的得意門生、cmu 副教授 ruslan,最近耐不住寂寞加入蘋果,擔任蘋果人工智能研究總監。斯坦福大學李飛飛教授也加入谷歌。

2. 雷鋒網:今年人工智能行業相比于去年有哪些宏觀和微觀的進步?

我感觸最深的是從 2006-2016 年這十年間,是深度學習的普及和推廣期,其在很多應用中取得突破性進展。但所有成果均為感覺方面的東西,如圖像識别、語音識别等。而從今年開始,最大的不同像 alphago 和自動駕駛等人工智能系統開始從感覺過渡到決策。這些系統基于對這個世界的了解,進而主動優化它的決策機制。是以從感覺到決策是最大的變化,人工智能隻有做決策才能真正改變世界。

我認為在未來的 10 年裡,怎麼優化地去做決策是人工智能的重點課題。

3. 雷鋒網:為何成立 open ai lab;為何選擇做嵌入式人工智能?

曆史上技術創新和商業模式的創新都是相伴相生的,我們也看到,開放總是會打敗封閉,怎麼打造良性的産業生态是我們非常關心的。是以最近地平線和 arm、安創空間、全志聯合成立 open ai lab,我們希望把技術向半導體廠商、開發者開放,大家一起去定義嵌入式人工智能的标準。至于為何要做嵌入式人工智能?過去推動人工智能的核心要素可以概括為大資料、大計算、大平台:其在網際網路和雲端做人工智能的技術與服務。如果朝更遠的方向看,我們會發現除了從雲端部署人工智能,其實很多場景下急需在裝置端部署人工智能,使這些裝置具備環境感覺、人機互動、決策控制的能力。

以自動駕駛為例,如果有孩子橫穿馬路,當自動駕駛系統感覺到之後,需要把信号傳送到雲端再做決策,假如當時網絡不穩定的話,結果是不可想象的,是以我們需要本地計算去做實時決策。

創業公司做項目一定要選擇大公司不大容易進入的次元,bat 在資料、人才、資源、服務方面的勢能,創業公司很難去挑戰。但本地低功耗人工智能計算不是他們的強項,也不是他們的業務重點。另外我認為創業一定要選難度較大的事情去做,嵌入式人工智能需要把軟硬體結合,并重新定義處理器架構,這是非常複雜的工程。這項任務雖然困難,但我認為隻要達到這樣的次元才能建構寬廣的護城河。我們希望把嵌入式人工智能建構成一種開放生态,使其未來在端上産生很多創新,讓意想不到的創新點在此發生:開放式生态可以把許多想法從一個創意變成産品,而這些想法和産品又會反哺地平線。

4. 雷鋒網:您覺得在 idl 和創業最大的差別在哪兒?

無論在 idl 還是在地平線,對我而言其實都是在創業和創新。當年我從國外回到北京,創立百度深度學習研究院,最初其實也是在做一件很新的事,當時國内沒有一家機構在做深度學習,因為它很小衆。初期我們被很多人質疑為什麼要投入這麼大的精力去做這麼窄的方向。然而在今天看來,這個很小衆的事情已經成為很多人都在關注的主題,整個世界也是以而改變。

地平線機器人實際上也是在做一件很小衆的事情,我們不在雲端、伺服器、gpu 上做,而是在嵌入式中去做人工智能,這也是件很小衆的事情,然而在我看來把一件事情從小做大是很讓人着迷的。

小公司相比于大公司資源确實十分匮乏,但實際上地平線的目标卻比我在百度期間的目标還要大,我們不是服務一個公司,而是撬動一個産業,這個挑戰難度比以往大了幾個數量級。

在創業公司坐事情的難度展現在方方面面,比如招聘,百度有着成熟、強大的 hr 體系支援我做這件事情。而小公司往往沒什麼名氣,如何吸引頂級人才加入也是一件難事。此外還有很多瑣事和細節,我們每天都在做非常具體的事情,但這又是很理想主義的事情,縱使挑戰難度很大,但這也使得人生更有意義。

5. 雷鋒網:根據你在大公司研究院和創業公司的招人經驗,分享下在 ai 團隊的招人心得。

在美國和百度時,招聘是我每天需要面對的事,是以我自身有着相當多的經驗。另一方面,在地平線我們也在積極吸引優秀人才的加入。吸引人才加入是一件很有挑戰的事情,因為現在人工智能人才還是比較稀少,我們做的事情又比較難,而且又是一條長線征途,是以有些人不了解我們的方向,我們做的事情在他們看來是既小衆又沒那麼容易變現的事。

我遇到一些從事人工智能算法的同學,他們有幾年深度學習經驗就迫不及待地想改變世界,是以不太願意去做一些偏長線的事情,但他們沒有意識到真正有價值的事情都是困難的事情、有壁壘的事情。是以我經常告訴他們創業是一場艱苦的修行,而不是一場 party,如果艱苦的修行走下來,無論是在路上還是在山頂上,那種滿足感和成就感都是無法比拟的。

當公司做的方向跟主流方向不一樣時,這種情況下吸引來的人才是極為難得和特殊的,因為他們是經過自己冷靜思考來做事情,這批人往往是推動公司上下做一番事業的人才。地平線确實非常有幸,在很短的時間内招到了頂尖人才:包括算法、軟體系統專家、硬體專家。我在百度時上司的團隊平均年齡是 26 歲,而地平線工程師平均年齡是 32 歲。因為我們是非常偏技術的公司,确實需要非常資深的人加入。

6. 雷鋒網:“現在最缺的是ai産品經理,而不是研究大牛”,你認同這句話嗎?

對于一個商業公司來講,算法人才和産品經理同等重要。這裡我要強調一點,何為研究大牛?我認為研究大牛的特質是“要有自己的思考和深厚的積累,他能夠持續的創新”。其實能創造性地做出世界級成果的人是非常稀缺的,在國内我認為隻有 5 到 10 人才能達到這個标準。一個算法人才普遍學習過 1-3 年的深度學習、會用開源平台去訓練模型,即使是這樣的人也不多,而這些人更談不上是研究大牛。是以我認為研究大牛是一種很稀缺的人才。

當然,ai 産品經理也非常重要,因為他定義需求。如果造出來一個東西技術水準高,但不能解決實際問題,技術再高也沒有實際價值。是以我們在創辦一個商業公司,ai 産品經理也十分重要。

7. 雷鋒網:外界有一種說法,大緻是目前各個to b的人工智能公司之間技術差距相對較小,是以很多時候銷售和商務團隊決定了公司的命運。你怎麼看待這個說法?

這個問題正中行業要害。從目前來講,絕大部分人工智能創業公司都是在基于 gpu 這樣的計算平台和在基于 caffe、tensorflow 這樣的開源平台用比較成熟的模型結構來訓練,然後做一些解決性問題和 demo,差異化确實不明顯。基于現在的開源模式來做創新,在算法方面壁壘确實也不高。

是以這就導緻在一些标準問題裡各家的效果都差不多,技術差距也并不大。這裡面的核心原因之一就是中國人工智能原創性技術太少。

最近大家在說中國 ai 的人才、技術儲備、研究、創新都有優勢,這個觀點我不太認同。實際上,國内學生在已經讨論出解決辦法的情況下去做拿競賽、刷分,這方面我們很擅長。但真正做出 alpahgo 這樣的創新,咱們還差些火候,而且國内也缺乏孵化這種創新的土壤。今年深度學習原創性的基礎研究在大步向前發展,然而我幾乎沒看到哪些進步是國内産生的。

另外一方面,商務和銷售确實非常重要,因為隻有把技術和具體應用場景拉近才能産生價值落地。技術研發也一定要有差異化,這種差異化如果隻是做研究,隻是去 follow 開源平台等這些大家都在讨論的事情,這是很主流的做法,如果你一定要關注主流算法,潛台詞就是你已經放棄了差異化。是以你一定要深入特定的問題,深入解決那個場景下的各種限制條件,去針對性地提出特殊的方法解決實際需求,這是讓你更有差異化的途徑。

科學家創業需要對商業和實際需求抱有充分的敬畏之心,商務和銷售團隊也并不至于決定公司的命運,關鍵在于團隊之間的配合。商務和銷售比較看重眼前需求,對技術趨勢缺乏準确預見,而一個公司要走得長遠,還得看清未來技術發展趨勢。

8. 雷鋒網:不少歐美 ai 初創公司最終賣給了谷歌等巨頭,但國内這種情況很少,你怎麼看待這一現象?

人工智能作為一個新的産業方向,早期都處于探索階段,初創技術公司獨立存活的機率并不高,是以會選擇被大公司收購,這是一個較為明智的做法。

國外工業界和技術創新生态比較健康,大公司願意付出成本為前沿性技術做人員收購,而且在不考慮成本的情況下。而國内很少有大公司願意為技術和人才收購付出很好的溢價。

其實每個公司被收購都有一個内在邏輯:這些公司不是範範地提供通用技術,而是在某個次元有着一定的獨特性,如 deepmind 不僅在做深度學習,還将深度學習與增強學習相結合然後應用在圍棋、遊戲等場景。這背後的邏輯,我認為很大程度上是文化原因。國内公司更願意用高成本去挖人,而不願為獨特團隊或知識産權付出高成本。我希望這個現象能發生改變,出現更多出于對人才和知識産權的收購。大公司如果能夠意識到這點,我覺得能夠對國内技術創新産生非常正面的影響。

人工智能産業仍處于早期階段,重大應用場景還在不斷摸索,産出的确非常低。但如果回到“.com”時代,你會發現當時的商業模式也是探索了很長時間。

資本市場确實有追逐短期回報的現象,是以明年下半年到後年,即便整個 ai 投資市場趨冷也并不奇怪。ai 行業與“.com”時代一樣,即便是趨冷,但也不會影響到整體的趨勢。因為 ai 确實在推動産業發展,實實在在創造價值,它不會進入一個萬劫不複的寒冬。

實事求是的說,如果按照投資機構的計算方法,ai 泡沫是一定存在的。ai 創業公司确實估值比較高,而且市場進展也并不盡如人意,到明年或後年一定會有所變化。從長期趨勢來看,适當泡沫純屬正常,就像啤酒有泡沫味道才更好,正是因為泡沫才讓各公司都有機會去登上舞台。不論怎樣,大家亮個嗓子,在舞台上唱一下。

我也經常跟投資人聊這個事,經過觀察國内十幾年的産業周期發現:以往多數項目均為 2c 産品,都是以産品創新和微創新為鮮明特征。中國沒有經曆通過技術創新為主的經濟增長模式,而矽谷等地已經曆過好幾波技術創新,這在中國很少見。中國大部分投資機構和創業者,并不善于技術類投資以及做 to b 這種生意,是以大家還不太習慣對這類公司進行估值。

我們一談到投資和創業,永遠面對新的産業方向,然而在面對新的産業方向即便是海外專業投資公司也不一定看得準,是以也能看到像投資 magicleap 這樣的新型公司都是有争議的。

ai 從純技術和純學術話題轉變為全社會讨論的話題,使得專業的聲音很有可能被淹沒,這是我所擔心的。投資機構和媒體的所有動向都會影響到産業的發展,ai 從業人員卻難控制。

ai 在内部環境受到 vc 和媒體的萬千寵愛,但外部的環境是很殘酷的、理性的、不相信眼淚的。在這種情況下,企業應保持冷靜,抓準切入的點,保證服務價值進而建構自己的護城河。整個行業的發展一定是由理性驅動,一定是由實實在在的需求和價值來驅動,是以我個人并不是特别擔心投資機構和媒體過多溺愛這個行業進而緻其堕落。當然,大浪淘沙一定會有所選擇,真正能夠平心靜氣把創業當作艱苦修行而非豪華盛宴的創業者會走到最後。

12. 雷鋒網:對 2017 年人工智能行業的格局和發展做個展望和預測。

我對 2017 年充滿了期待,希望這幾大方向有着一定的進展:

希望人工智能處理器硬體行業會有大的突破。

算法上繼續持續創新。

應用場景上的重大突破:如醫療、自動駕駛、智能家居等。

從整個創業投資角度講,明年下半年 vc 應該會更加冷靜、理性地思考,這裡并不是指降低投資力度,而是聚焦投資範圍。同時對未來發展方向和路徑會考慮地更加清楚,把資本注入重點方向和具有價值的團隊。

1.怎麼看待近期谷歌無人車事業部拆分成獨立公司?這個案例可否了解為自動駕駛已經遇到天花闆了?

從百度到地平線,我都做過自動駕駛的事情。根據我自身觀察,谷歌無人車事業部拆分這件事一點都不奇怪。谷歌一直存在幾個嚴重問題:

商業政策:谷歌沒有思考清楚商業模式,到底該提供整車,還是成為技術服務商、供應商。

技術路線:谷歌的計劃很激進,想一步跨到不需要方向盤的無人駕駛水準。事實上谷歌的雖然目标很大,但技術路線較為很保守,導緻目标與技術路線并不比對。谷歌無人車是基于高精度地圖的自動駕駛方案,該方案有很大局限性,需要事先對整個環境做出全面感覺,這使得其在處理不确定性事件方面有所欠缺。這種不确定性展現在長尾情況,而不是常見情況,而在長尾挑戰層面,谷歌在技術線上沒有很好地去處理這個問題。

2.如何看待近期比較熱的強化學習和遷移學習,他們在應用方面的發展現狀怎麼樣,以及所面臨的挑戰?

強化學習現在面臨的主要挑戰是怎麼 handle long-term dependence 的問題,如果最後它 reward 很長時間才顯現,它怎麼去影響目前的 policy ,是一個很大的問題。強化學習的代表 alphago 實際上運用了巧妙的方法如 learning from experience 去下圍棋,這一點很有意思 。那麼未來如何在理論上有一個優美的架構,我覺得還是挺值得探讨的。

另外,強化學習的架構相對而言是一個比較黑箱的系統,這與感覺不同,在感覺方面黑箱一點也可以,但在決策上一定要用白箱的、可了解的方式去做,尤其是自動駕駛領域。

關于遷移學習這一問題,其實深度學習、神經網絡天然就擁有遷移學習的特性,比如用 imagenet 去訓練網絡結構,實際上它的很大一部分參數在其他問題上可以複用。在參數領域的遷移學習,大家都搞的比較清楚,但在結構方面的遷移學習,現在還并不太清楚。結構反映了更高層的學習問題,基于模型結構的遷移學習将會是下一個熱點。

3.您對哪個深度學習開源平台在 2017 年的發展有比較大的期待?

谷歌依靠自己強大的号召力推動了 tensorflow,鑒于其強大背景,使得它在明年仍舊很值得期待。而在近期被亞馬遜選為官方平台的 mxnet 同樣值得期待,mxnet 是一個更加開放的中性平台。如果想深入開發技術、開發原創新技術、追求技術自主性的話推薦用 mxnet。從生态層面講,如果整個人工智能的開發都基于 tensorflow,這對生态的健康有着負面影響,容易被一家公司壟斷,将會影響到産業鍊的方方面面,如處理器和應用等方面的部署。

除此之外,也推薦大家使用我在百度期間孵化的“親兒子”百度 paddlepaddle。

我先下個結論:最不容易成功的是基于純算法的公司,主要原因是壁壘低。現在新的開源創新方式使得新算法不斷冒出來,基本上每個小時都在創新,如果一個公司的核心競争力基于聰明程度,這很不靠譜。這個世界上永遠比你更聰明的人,而且很多。

無論是平台還是産品,其核心競争力在這兩方面:

巨大的市場需求

足夠的差異化和獨特性,不可複制性

滿足這兩點,你的産品和解決方案或服務才擁有核心競争力。

人工智能的冰與火之歌:回顧2016,展望2017(餘凱)丨硬創公開課

本文作者:亞峰

繼續閱讀