天天看點

計算機出現之前,人類已将算法用到生活中︱讀+

作者:長江日報

大美宇宙,一切可“算”

數學反映自然的本質。數學不僅結論是美的,方法是美的,結構也是美的,數學就是自然美的抽象畫。數學本是求真的工具,卻也成了世界美善的化身。

算法的過人之處在于用簡潔、快速的方式揭示事物的萬般複雜。文學家把一句話擴充成一本書,數學家及其應用者把一句話濃縮為一個符号。數學算法關注萬事萬物的數與形,高度的抽象無妨内涵的豐富、軌迹的準确、應用的廣泛。在靜止中看到運動,在變化中洞悉規律,算法充滿“真魔力”。

數學讓宇宙更呈雅緻、嚴謹、和諧之态,算法讓宇宙更加“肉眼可見”,更加可觸可感。數學算法常常帶給我們不可思議的結論,不符合感性常識,但在很長一段時間裡人們必須把它“當真”,嚴肅對待,直到它被完全肯定或徹底推翻。

本期讀+專訪談算法,談大資料技術的進展和妙用。算法是數學的一個重要應用,正在大踏步全面“進入”現代生活,與無數人近距離、零距離甚至負距離發生接觸。這種全面進入,産生了初始階段常見的摩擦,也引起了一些不适和反感。但是無論如何,這個大勢所趨恐怕再難逆轉——因為算法帶來的美,帶來的生活便利,畢竟是更積極更主要的方面。(劉功虎)

《算法之美》

計算機出現之前,人類已将算法用到生活中︱讀+

[美]布萊恩·克裡斯汀 湯姆·格裡菲思 著

萬慧 胡小銳 譯

中信出版集團

《算法之美》作者、美國人工智能專家布萊恩·克裡斯汀:

計算機出現之前,人類已将算法用到生活中

從“算法歧視”到“大資料殺熟”,再到“資訊繭房”,“算法”在當下常引起一些争議。但技術作為一種工具,關鍵是使用得當,就可朝着更健康、更美好的方向發展。

美國人工智能專家、《算法之美》作者布萊恩·克裡斯汀近期應國内安遠AI和機器之心之邀做了遠端講座,并接受了長江日報讀+提問。在他看來,算法可以解決人類生活中的許多具體問題,并預測,未來十年最重要的研究之一,就是讓人工智能精準地實作人類想要的目标。

計算機出現之前,人類已将算法用到生活中︱讀+

布萊恩·克裡斯汀。

“算法”在愛情問題上也行得通

“算法”(algorithm)這個詞得名于波斯數學家花拉子密。公元9世紀,這個數學家寫過一本書,讨論用紙筆解決數學問題的技巧。

不過,最早的數學算法早于花拉子密。巴格達附近曾出土了4000年前蘇美爾人泥闆文獻,上面就刻有一幅長除法示意圖。

但是,“算法”又不僅限于“數學”。

在按照食譜介紹烤面包時,食譜上的所有步驟就是一個“算法”。

按照圖樣編織毛衣時,這份圖樣就是一個“算法”。

使用鹿角的末端連續精确地敲打,使石器形成鋒利的刃的過程,也遵循着一個“算法”。

從石器時代開始,“算法”就已經是人類生活的一部分了。

那麼現代社會呢?我們身邊總有一些朋友有所謂的“選擇困難症”,比如炒股時何時套現脫身?看過多少套房子才可以出手買下?接觸多少人之後,才可以确定自己的理想伴侶?一邊怕自己沖動,一邊又怕自己錯過。

布萊恩·克裡斯汀認為,這些人是在自尋煩惱:“他們需要的不是治療師,而是一種算法。”因為這類問題至少可以通過數學方法來解決。在沖動與不錯過之間找到一個平衡點,算法告訴他們,答案其實很簡單,就是37%。

他舉了個例子。舊金山是整個美國最難找房子的城市,房租甚至比紐約還高。房源一放出,房子就會被一搶而空。消費者一般都斟酌半天,但舊金山的租客沒這個特權。

怎麼避免“看過的好房子被人挑走”“還有好房子沒來得及看”這兩種遺憾呢?克裡斯汀提到了“37%法則”。意思是,如果你希望選中最合适較高價的電梯大廈的可能性達到最大,那麼在看前37%的房子時不要做出任何決定;如果你準備花一個月的時間挑選房子,那麼在前11天不要做出決定。但是,一旦過了這個時間點,你要做好随時簽約的準備。

這可不是直覺,而是已經得到證明的“最優解”,屬于數學上被稱作“最優停止”的一類問題。“37%法則”就是來解決這些問題的簡化步驟,計算機科學稱之為“算法”。

至少從17世紀開始,愛情問題就已經讓數學家頭疼了。沒關系,“37%法則”在情感問題上也行得通。有一位教授年輕時曾為尋覓真愛而苦惱,當時他還是一名研究所學生。他突然想起37%法則,假設從18歲開始,至40歲結束,那麼根據37%法則,在26.1歲時他就應該結束觀察期,随時果斷出手。碰巧的是,當時的他正處于那個年齡。當他發現某一名女性比之前所有約會對象都優秀的時候,他果斷行動了。

人類的“小算盤”有多複雜,算法就有多複雜

“算法”的處境有些尴尬:它在各學科的夾縫中找立足之地,最初,它在人們看來是數學與工程技術糅合而成的怪異混合體。

現在,為人類設計算法的工作也面臨相同的境遇——找不到一個現成的歸屬學科。“今天的算法設計不僅需要借助計算機科學、數學和工程技術,還需要得到統計學、運籌學等相關領域的幫助。此外,我們不僅需要考慮計算機算法設計與人類思維活動之間的關系,還需要認真研究認知學、心理學、經濟學等學科。”布萊恩·克裡斯汀大學學習的是計算機科學和哲學,研究所學生階段學習的是英語,畢業之後從事的是與這三個學科都相關的工作。

之是以涉及的學科多,是因為人類問題很複雜。大學畢業後的夏天,布萊恩曾和兩個朋友去西班牙旅行。他們在飛行途中商定了旅行路線,有一點很清楚,他們沒有時間去看之前計劃過的鬥牛表演。

三個人都試圖安慰另外兩人,就在這時,他們突然發現,事實上他們中沒有一個人想要看鬥牛。每一個人都隻是虛僞地熱情一下,這導緻其他人也積極表現出相同的熱情。而且,看似無害的語言比如“哦,我無所謂”或者“你今晚想做什麼”實則含有黑暗的計算弱點。它表面上是善意的,卻傳遞了潛台詞:“由你來負責。”不說自己的喜好,而讓其他人猜測,這是很大的計算負擔。

真正讓大家輕松的方式,是禮貌表達你的喜好:“我個人傾向于某某,你認為是什麼?”提供2到3家餐館的選擇,大家再消除他們最不喜歡的選項,那就會使任務變得更容易。就算是不太禮貌的拒絕,也在明顯降低計算成本。

這個案例可見,人類的“小算盤”有多麼複雜,面對的難題有多麼複雜,算法就有多複雜、多容易出錯。

【訪談】

算法很古老,早于計算機出現

讀+:為什麼我們一定需要算法,靠自己做決定不行嗎?

布萊恩:算法就是解決問題的一系列步驟,不是有計算機才有算法,恰恰相反,在計算機開始使用算法之前,人類早就将算法應用到生活當中了。人類的生活很複雜,經常遇到難題,找不到現成的答案。很多問題,從本質上看,都是一些計算問題。“算法”就是把問題簡單化,幫助人們獲得直覺。該怎麼整理辦公桌、如何合理地填充櫥櫃、如何合理安排日程,這些都能靠算法解決。換句話說,人們是在借助計算機科學回答“如何度過一生”這個最古老的問題。

對人類來說,“如何把握今天”可能不是一件易事,但是計算機可以輕輕松松地把握每一毫秒。顯然,計算機有很多值得我們借鑒的地方。如今,算法與大資料、政府、企業有密切的聯系,正在逐漸變成現代社會基礎架構中一個越來越重要的部分。

很多人等公共汽車時,如果有一個實時顯示器提示說,下一輛車“10分鐘後到達”,這種算法無疑是很貼心的,你可以決定是否繼續等待,而不是左顧右盼,不停張望。這10分鐘内你可以目視前方,少了很多焦慮,這是計算的善意。

衣服太多沒處放,從計算機角度看,你的衣櫃是一級緩存,地下室是另一級,自助存儲櫃是第三個,你也可以再添加一個比壁櫥體積更小、速度更快、距離更近的緩存,比如說在床邊放一個衣物架。雖然衣物架現在已經不多見了,但它可以挂夾克、領帶和褲子,是你的家庭緩存必備的完美物件。這個例子表明,計算機科學家不僅可以節省你的時間,還可以幫你做家務。

讀+:在很多人看來,讓計算機來告訴我們如何思考、應該采取哪些行動,是不是太兒戲了?是以對算法會有些抗拒。

布萊恩:部分原因是我們把計算機看成了機械呆闆的系統,覺得計算機科學把問題過于簡單化了,覺得具有誤導性。讀一讀講人工智能和機器人的科幻小說就會發現,那樣的生活似乎不是我們向往的。人們覺得,把算法與人類生活相提并論似乎很奇怪,“算法”這個詞聽起來像是神秘莫測的謀劃與操作。

阿蘭·圖靈是第一個設想出計算機的人,他通過類比的方式給出計算的定義,計算機學習的原型就是人類數學家。數學家通過長長的計算步驟,最終得出絕對正确的答案。普通人以為計算機是機械呆闆的,但現代計算機處理難題的方式并不是那樣。

谷歌有兩位研究人員,他們在學生時代曾研究過機器人足球比賽。本來,足球機器人在球場上随機徘徊,不知道該做什麼,而研究人員給了機器人微小的數字激勵,大約0.01分,獎勵機器人獲得球權。他們發現,機器人學會了小心翼翼地接近球,然後盡可能快地振動它的“腳”,一秒鐘取得球權50次。如果你和任何強化學習的研究人員聊,他們都有自己的一套類似的“恐怖”故事。

我的一個朋友是普林斯頓大學的一名認知科學家,也是一位父親。有一天,他五歲的女兒在廚房裡掃了一些垃圾到垃圾桶裡。他誇女兒:“哇,幹得好,寶貝,你掃得真好。”他的女兒微笑着,非常自豪,然後拿出垃圾桶,把垃圾全部倒在地闆上,好再次開始掃地,進而得到更多的表揚。這兩個例子非常有趣,機器人能做到和人類的思考模式幾乎相似。

80年前的童話預示了人工智能的未來

讀+:靠算法推薦的東西,可能并不全是我們心裡想要的,這是不是說明算法并不可靠?

布萊恩:目前還沒有永遠不會犯錯誤的有效算法,即使是最前沿的計算機科學也沒開發出來,在完成想象、語言、因果推理在内的大量認知任務時,4歲兒童的能力仍然超過成本高昂的超級計算機。

在過去的一二十年裡,行為經濟學對人類進行了非常具體的研究,結果發現,人類不理性,很容易犯錯誤,問題的源頭是大腦。人類不斷面對高難度問題,因為幹擾因素太多,比如不确定性、時間有限、資訊不全、情況瞬息萬變等。

大腦是容易出錯,但問題也太難了。計算機科學面臨的最難解決的問題是人機對話、修複破損檔案、下圍棋取勝。這些問題的規則都不明确,所需要的資訊也不全,有的還需要考慮無數種可能性。要解決這些,就必須處理好這些“可能”,利用粗略估算,在時間與精确度之間做出某種妥協。

讀+:既然不是完全可靠,我們能相信它們做的是我們想要的事情嗎?

布萊恩:這遠遠不是一個新的擔憂。事實上,它可以追溯到1960年,當時麻省理工學院控制論教授諾伯特·維納寫了一篇我認為非常有前瞻性的文章,叫做《關于自動化帶來的一些道德與技術後果》。維納用1940年上映的米老鼠卡通片《幻想曲》之《魔法師的學徒》做了一個比喻。米老鼠是一個業餘的魔術師,他給掃帚施了魔法,并給它簡單的指令,比如“從井裡打水把大鍋灌滿”。然而,米老鼠在制定指令時不夠精确——看過這部動畫的人都知道,他最後差點淹死自己,而這時大魔術師出現并救了他。

維納寫道,這不僅僅是童話故事,這就是我們與人工智能關系的未來。他有一句非常著名的話:“如果為了實作我們的目标,我們使用這樣的一種機械機構:一旦啟動就無法對其操作進行幹預,那麼我們最好确定,我們輸入機器的目标是我們真正想要的。”

今天,這個問題已經成為了人工智能領域的核心問題之一,我們把它稱為“對齊”問題。其實“對齊”并不僅僅是人工智能領域的問題,比如教育系統為考試成績進行優化,但學生隻是變得非常擅長考試,他們不一定能學得更好;甚至在全球範圍内,我們為經濟增長進行優化,但也對氣候産生了可怕的影響。我相信,解決“對齊”問題将是未來十年對科學和人類來說最重要的研究之一。

計算機出現之前,人類已将算法用到生活中︱讀+

諾伯特·維納和米老鼠卡通片《幻想曲》之《魔法師的學徒》。

整個世界逐漸置于“自動駕駛”狀态

讀+:就你觀察,在人工智能領域有哪些“不對齊”的表現?

布萊恩:比如有些社交軟體最大化每周滑屏的次數,但讓每個人都很不開心,因為他們不斷滑屏,停不下來,引起上瘾的問題。自動駕駛汽車如果路上遇到障礙物,也許一半的司機會向左轉,一半的司機會向右轉。如果取平均,車就會直線行駛。我看到有學者正在思考如何對多個使用者的偏好或異質偏好進行強化學習。

當你用智能手機拍一張照片,這麼簡單的動作,包含了大約11、12個環節,它包辦了從自動曝光到焦距、白平衡、色彩校正、去噪和将多次曝光融合在一起的一切。這些都是無聲無息發生的。同時,手機也在決定你能拍和不能拍的照片類型。我的一個朋友和我說,他很難用他的蘋果手機拍攝夜間落雪的照片,因為蘋果手機會認為雪是噪點,并将雪從他的照片中去掉。手機拍照的例子說明了人類與機器學習的關系,它是廣泛的,同時也是隐蔽的,而且并不一定用我們認可的方式。

2018年優步汽車在亞利桑那州撞死一名行人,我讀過美國國家運輸安全委員會關于該事件的報告,我很震驚。報告顯示,該系統基本上沒有任何關于亂穿馬路者的訓練資料。它隻看過人們在有标志的人行橫道上過馬路的例子。更重要的是,該系統建立在一個有着非常嚴格的分類系統的物體識别系統上,分類包括行人和騎自行車的人,而且這些分類各有成千上萬的例子。但是在這起事件中,這位女性正推着自行車過馬路,這是系統從來沒有見過的,是以最終造成了不幸的結果:它撞到了這位女性。

我們絕對生活在一個變革時期。我從朋友那裡聽過一個非常有趣的說法,他多年來在汽車企業負責人工智能開發,他把機器學習軟體比喻為一種真菌,正在侵蝕着他和他的團隊多年來辛苦編寫的C++代碼。

我提到這一點是因為有一種說法,說機器學習正在取代人類的專業知識和判斷。機器學習系統也正日益參與到我們公共機構的決策中。總的來說,機器學習正在取代人類專家和傳統軟體,它正在改變我們日常互動的方式,也有可能決定我們的生活軌迹。

在我看來,整個世界正逐漸置于“自動駕駛”狀态。是以,我認為,我們有很多理由對此抱有一絲擔憂。

最不受待見的想法成為計算機科學發展的“黑馬”

讀+:你2020年出版了《對齊問題》一書,這兩年來,人工智能領域應該又有一些變化,你是否能預見未來五到十年的發展?

布萊恩:這個領域的變化非常快,那本書出版到今天,短短兩年時間裡,也已經有了一些重大變化。在過去的兩年裡,一些想法已從學術研究進入到實際的行業實踐。有些東西在兩三年前還隻出現在白闆上和會議論文中,而現在它們已經成為一些人工智能公司工作中的主要部分。

我看到了一些非常有趣的景象,不僅大學裡有人工智能安全實驗室,像谷歌等大公司也有了。我也看到做人工智能安全的初創公司開始出現。一兩年前,這些都還不存在。

關于我如何預見未來五到十年的發展,我認為最顯著的一點就是這個領域的快速發展。一些起初在計算機科學界不受待見的想法,卻迅速變成了計算機科學領域裡發展最快的。

有一位研究人員曾告訴我,他2016年參加一個會議時,他說他從事的是人工智能“對齊”,沒人知道他在說什麼。而到了2017年,出現了一個研讨會專門讨論“對齊”。到現在,“對齊”有了大型分會場,圍繞“對齊”的行業也出現。我認為,解決對齊問題可能是2020年代,甚至整個世紀決定性人類工程。

在未來,可能會有越來越多的人的工作是引導或操縱人工智能系統。我甚至懷疑,即使是沒有計算機科學學科背景的人,也很有可能去從事這項工作。

讀+:算法已經在許多領域取代了許多人,甚至在創造性工作和決策相關的工作中。那麼,你對人工智能的大規模自動化可能對人們的生活和價值觀的潛在影響有什麼看法?

布萊恩:這是一個非常重要的問題。有太多東西試圖引導我們的注意力。我有一天讀到了一些資料,也許記得不準,說是百分之八十以上的視訊是人們通過推薦點選的,而不是刻意搜尋的。也就是說,你帶着意圖來到系統,與你根據建議而點選的比例大約是一比四。

我們的手機有點咄咄逼人地建議我們的說話方式,是以我鼓勵人們在頭腦中想好發送的文本再輸入,因為這些系統雖然沒有任何意圖甚至說邪惡的意圖,但卻在引導大家走向一種相似的說話方式。

我舉個例子,在英語中,有一個稍微不太尋常的詞“生病”(ill)。每次我打出“我感覺不舒服(I’m felling ill)”的時候,我的手機就會把它糾正為“I’ll”——即“I will”的縮寫。這是一個完全不同的詞,但它是一個更常用的詞。是以,我的反應是放棄拼寫ill。但如果我使用“sick”這個詞,那手機就不會出任何問題。這雖然是一個非常小的例子,但我認為人類應維持核心角色,模型應該向我們學習,我們應處于主導地位。我們可以借用電影《大白鲨》的一句台詞:我們需要一艘更大的船以及更好的算法。

讀+:目前算法有這麼多的不足,但是人工智能領域發展迅速,肉眼可見地進步,我們該如何正确評價算法?

布萊恩:計算機科學是充滿智慧的,從算法中我們也能觀察出人類自己的思維模式。很多問題本質上是計算性的,這使計算機不僅成為我們的工具,也成為我們的夥伴。計算機科學家和數學家已經确定了很好的算法方法,這些算法可以簡單地轉移到人類問題上,而且,即使你沒有得到你想要的結果,但你也要明白,你正在使用最優選擇之一。

據我對計算機科學家的了解,他們常認為的“足夠好”真的已經足夠好了。任何一種好的算法的指令都是把思考的勞動最小化,讓人們避免不必要的緊張、摩擦和精神勞動。

它告訴我們:不要總是考慮所有的可選方案;不必每次都追求最佳結果;偶爾犯點兒錯誤;放下包袱,輕裝前進;放松自己,忠于自我。用計算機科學的智慧指引自己的人生之路,這似乎是一條不錯的建議。

(長江日報記者秦孟婷)

【編輯:王戎飛】

更多精彩内容,請在各大應用市場下載下傳“大武漢”用戶端。