加州伯克利新算法：打破AI黑箱可按人類思維回溯推理

在某些情況下，我們常常無法對自己的行為作出合理的解釋。例如一場說走就走的旅行，一次奮不顧身的愛情，事後人們常常無法相信當時的自己究竟為什麼會做出那樣的選擇。但這種情況畢竟是少數，大多數時候，我們都具有自我解釋和自我認知的能力，而這一點也是人類與機器人（或者說人工智能）最大的差別之一。

一般我們所說的人工智能，其實說到底就是由一段程式代碼組成的複雜運算系統，這個系統能夠根據輸入資料得出一個運算結果，而這個結果的外在展現就是人工智能。在通常情況下，我們隻能看到輸入的資料和最終的運算結果，至于中間的運算過程究竟怎樣，則一概不知。

這會帶來兩方面的缺陷：一是當整個系統出現問題時，我們無法迅速準确地對問題進行定位并實施改進；二是當人工智能得到一個近乎完美的運算結果時，我們無法回溯整個過程，并從中汲取經驗（雷鋒網注：也就是我們常說的“ai決策黑箱”）。

現在有一個正在迅速成長的研究領域，正在試圖改變這一現狀。

拿圖像識别的場景來說。通常的做法是：我們會将一系列的圖像資料輸入系統，然後系統會以既定的模式識别出圖像中的物體，并予以标記。在現實場景中，每張圖檔包含的資訊都非常複雜，這使得一旦出現标記錯誤，我們将很難回溯整個标記流程，進而也很難定位并解決問題。

日前來自加州伯克利大學和max planck資訊研究所的科學家們發明了一種全新的圖像識别算法，可以解決這一難題。該算法除了能夠按照一般的流程對圖像資訊進行識别并加以标記之外，還能對産生這一标記的原始資料進行記錄，并将這一原始資料“翻譯”成人類可以了解的語言備份下來，友善研究者們回溯和檢查。

根據團隊發表的論文，目前這一算法還僅限于識别圖像裡的人物動作資訊（例如這個人是在打棒球還是騎自行車），而且需要基于兩種不同的資料集合的支援。第一個集合是關于圖像資訊本身的，包括圖像、圖像的初步描述、以及圖像的進一步說明。例如一個打棒球的照片，描述資訊可以是“圖中有一個棒球棍，以及一個人握着它”，說明資訊可以是“這個人正在握着棒子揮舞”。第二個集合是關于圖像資訊解釋的，其中包括三個圖像的相關問題，而且針對每個問題要給出10種可能的答案。例如問：“這個人是在打棒球麼？”一種回答可以是：“不是，因為圖中沒有棒球棍。”

正是基于上述兩種資料集合的支援，當某個利用了這種算法的神經網絡系統被問到為什麼将圖檔描述為“打棒球”時，它就可以追溯到最原始的定位資訊，并将之描述出來：例如它檢測到圖中出現了一個棒球棍，以及一個人在握着這根棒球棍揮舞，是以得出結論這是一個打棒球的照片。研究者們稱之為“标記并解釋”系統，因為它不但能描述一張圖檔的内容，還能指出為什麼得出了這樣的結論。

微軟首席研究員kate crawford在評論中指出：工程師們已經開發出了能夠自動識别不同種類的貓、狗或者其他内容的深度學習系統。雖然這些系統的表現随着研究的深入正在變得越來越好，但人們始終無法搞清楚背後的邏輯，即為什麼系統會得到這個結論。

kate crawford的觀點觸及了機器學習領域的一個核心問題：當一個算法進行自我學習時，它隻能根據研究者輸入的資料（可以是文本，也可以是圖像或者視訊等），提取出關鍵的資訊，并将這些資訊按照隻有機器自己才能了解的方式加以歸類和整理，這一過程完全不需要人類的直接參與，人類也無法加以觀察和控制。

波士頓大學計算機學科的教授kate saenko表示：實際上并沒有人能夠設計一個深度神經網絡。人們隻是設計了這個系統的算法，并提供了相應的資料集合，剩下的都由系統自主完成。

是以，這就是來自加州伯克利大學和max planck資訊研究所這一最新算法的重要意義：它能将機器内部的邏輯鍊條翻譯出來展示給人類，而不是簡單的僅僅給出一個結論。

歐洲計算機視覺聯會的主席，facebook通路學者devi parikh表示：這一算法的難點不在于解釋一個結論本身，而是如何以人類能了解的方式表述出來。因為如果你看到過機器内部的運算流程，就會發現其中所有的參數和中間變量都是以數字的形式出現的，有些數字甚至長達數百上千位。是以，從内部的運算邏輯中找到一個結論的源頭資料或許并不困難，真正困難的是如何将這一長串數字翻譯成人類能夠了解的語言。

雖然目前來看，來自加州伯克利大學和max planck資訊研究所的這一最新研究成果還非常具有局限性（例如隻能識别人類的動作）。但更重要的是，它為我們指明了一種未來可能出現的現實場景：不但能夠從機器那裡得到一件事情的具體決策，還能像跟朋友聊天一樣詢問它得到這一結論的原因。未來，随着我們賦予機器越來越關鍵資訊的決策能力（例如自動駕駛），這種能夠自我解釋的機制也将變得越來越重要。

當然，如果像此前的報道那樣，機器有一天也終于學會了騙人，那就是另一個故事了。

本文作者：恒亮@雷鋒網

本文責編：岑峰@雷鋒網(公衆号：雷鋒網)

【兼職召集令！】

如果你對未來充滿憧憬，喜歡探索改變世界的科技進展，look no further！

我們需要這樣的你：

精通英語，對技術與産品感興趣，關注人工智能學術動态的蘿莉&萌妹子&技術宅；

文字不求妙筆生花，但希望通俗易懂；

在這裡，你會收獲：

一群來自天南地北、志同道合的小夥伴；

前沿學術科技動态，每天為自己充充電；

更高的生活品質，翻翻文章就能掙到零花錢；

有意向的小夥伴們把個人介紹/履歷發至 [email protected]，如有作品，歡迎一并附上。

本文作者：恒亮

加州伯克利新算法：打破AI黑箱可按人類思維回溯推理 | 重大突破

繼續閱讀

開源低帶寬語音編解碼器

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希

加州伯克利新算法：打破AI黑箱 可按人類思維回溯推理 | 重大突破

繼續閱讀

加州伯克利新算法：打破AI黑箱可按人類思維回溯推理 | 重大突破