天天看點

一位AI研究員+區塊鍊創業者的終極展望:AI DAO将統治世界

Trent McConaghy是一位資深的AI研究員,從上世紀90年代開始從事AI方面的研究。截止到2016年年底,Trent已經在相關領域釋出過35篇論文、出版過2本書籍、注冊過20項專利、并先後創辦過3家公司。2013年的一天,當時正為比特币技術狂熱的Trent跟他的藝術家夫人Masha在柏林逛了一次畫展,在參觀回家後的閑聊中,兩人展開了一個問題:區塊鍊技術能夠應用到藝術品上嗎?我們能否以擷取比特币的方式去擷取一件藝術品的數位版本,同時保護藝術家對該作品的版權?

Trent由此投身區塊鍊創業,建立了ascribe公司。由于比特币的區塊鍊實作方式限制了每秒最多能夠處理的交易數量,無法滿足ascribe對可擴充性方面的要求,Trent又發起了BigchainDB項目,成立了BigchainDB公司和IP資料共享組織IPDB。

從2015年到2016年,Trent在PyData、Blockchain meetup、Machine Learning Group等各種活動上活躍分享其在區塊鍊與AI方面的思考,并在Medium上撰寫了大量文章。其中有幾篇文章重點描述了AI技術與區塊鍊技術之間将可能有怎樣的互補,内容非常精彩。本文對這些内容做一個簡單的導讀,希望能對大家有所幫助。

AI DAO的構想

2016年6月18日,正是The DAO項目處于風口浪尖的時候,Trent在這一天釋出了這篇有關AI DAOs的文章,後續又釋出了第二篇和第三篇。

我在十歲那年讀到了一本描述AI的書,從此不能自拔。後來,我用了将近二十年的時間投入到專業的AI研究工作當中。三年前,我從AI的世界走了出來,進入到一個同樣重要的新世界:去中心化。現在,這兩個世界很快就要重疊。

Trent認為“去中心化”技術的發展将經曆五次浪潮:

  1. 比特币
  2. 區塊鍊
  3. 智能合約
  4. DAO——去中心化的自動化組織 Decentralized Autonomous Organizations
  5. AI DAO

DAO是一種可以自動運作在去中心化基礎架構上的計算程序,具有資源管理的能力。

比特币網絡是DAO。以太坊網絡是DAO。DAO上面還可以跑其他DAO,比如The DAO就跑在以太坊上。

DAO是一個腳本,平時就坐在那裡,等待某個交易來觸發運作。

Trent定義的AI DAO具備如下特性:

  1. 通路資源的能力
  2. 征用更多資源的能力
  3. 拒絕人為幹涉的能力

而這可能通過三種途徑來實作:

  1. 将智能合約的邊緣執行單元交給AI(自動化投票)
  2. 将智能合約的中心交給AI(自動化回報控制系統)
  3. 從叢集中自動湧現出AI的複雜性

AI DAO會更強大,也會更不可控。在系列的第二篇文章裡,Trent舉了個例子:想象一個The ArtDAO,其智能合約是這樣運作的:

  1. 節點上運作了一個AI畫圖引擎,自動生成一張有藝術感的圖檔(相關的實作已經有很多,可參考這篇文章)
  2. 節點自動去ascribe給自己生成的圖檔注冊一個著作權(雖然今天的法律未必會保護機器人的著作權法人權益)
  3. 節點在ascribe上創作該圖檔的不同版本,比如木刻效果或者浮雕效果的
  4. 節點把這些各種版本的圖拿到市場上賣,比如Getty、Hopify或者OpenBazaar
  5. 如果有買家想要這些圖檔的二次售賣權、公開展示權等許可,節點就在ascribe上把相關許可賣給他,收獲相應的虛拟貨币(如以太币)
  6. 節點創作更多的圖,賺更多的錢,買更多的計算資源,再創作更多的圖,再賺更多的錢,變成富翁

圖:一張AI的畫作

理論上,這個ArtDAO可以不跟任何人類分成,它存在于世的目的就是不斷創作更多更好的“畫作”(就像一個人類藝術家一樣),不吃不喝不眠不休永不停止(這是人類藝術家所做不到的)。ArtDAO還有可能自我更新,而且自我更新的能力可以越來越強,比如:

  1. ArtDAO看到哪一類畫作被買得最多,就多創作那一類。
  2. ArtDAO雇傭幾個人類來給自己的畫作評分。
  3. ArtDAO雇傭幾個程式員來改進自己的智能合約代碼。
  4. ArtDAO自己修改自己的智能合約代碼,不斷收集市場回報并調試,最終得到更好的畫圖能力

到這一步,ArtDAO可能會從其他的DAO或者Github上搜尋代碼,跟自己的代碼雜交生成下一代。而這些生成的下一代,可能不僅僅是畫圖能力産生了變化,還可能會改變ArtDAO的核心目标。“下一代”可能不再把“作畫”做為自己的“DAO生”目标,而是其他的什麼目标,比如檢查軟體中的安全漏洞。如果新生的目标有對人類不利的成分,那人類這個物種說不定會被AI DAO淘汰……

AI DAO不是科幻,而是我們已經能在今天建構的事物。

AI是一個強力而危險的技術。DAO們是強力而危險的技術。AI沒有的資源,DAO有;DAO沒有的自主決策能力,AI有。AI DAO是更強力更危險的技術。

于是在系列的第三篇文章中,Trent繼續寫到:

AI掌握人類的資源是大趨勢,無論是我們拱手相讓,還是AI強取豪奪。我們正在将大量金錢投入AI。我們已經在将工廠的生産線、汽車和飛機交給AI。我們為了提升效率,将不同領域的AI合并為通用的高等級AI。我們為了不讓某個企業或國家壟斷最強力的AI系統,而設計了去中心化的AI DAO。

人類是高消耗低産出的任務處理單元。機器是低消耗高産出的任務處理單元。以效率之名,AI最終會在所有生産行為中“優化”掉人類。

Trent認為AI超越人類的那一天可能比很多人想象得更早(這在一些狹義領域已經實作了,比如圍棋大師),并提出四點理由:

  1. 摩爾定律将繼續生效(這是作者的觀點)。對于很多AI而言,即使算法沒有改良,單純投入更多的算力(CPU、帶寬、存儲)就能夠變強。
  2. 資本對AI的青睐已經産生了多方面的影響:小白使用者也可以使用深度神經網絡得到不錯的結果;無監督學習能力的成熟;專用晶片大幅加成AI的效率(從通用晶片 -> GPU -> FPGA -> digital ASIC -> analog ASIC,每一次改進就是10倍的效率提升)。
  3. DAO的發展程度,已經足以提供讓AI自行擷取資源的能力。
  4. AI的發展道路上,并不存在根本性的阻礙。

當區塊鍊遇到大資料

2016年年底,Trent先後撰文兩篇,其一是《區塊鍊與大資料》,其二是《區塊鍊與AI》。

在21世紀最初的幾年間,網際網路規模的大資料方案開始成形:Yahoo的ZooKeeper,Google的BigTable與MapReduce,Facebook的Cassandra,然後是開源的Hadoop檔案系統、Hadoop MapReduce、Cassandra等。到2010年前後,MongoDB、Cloudera、DataStax等初創企業又把這些開源的大資料項目做成了商業方案。今天,大資料技術正在靜悄悄的改變世界上每一個企業的後端。

Trent認為目前的大資料技術正面臨三個關鍵挑戰:

  1. 控制權。誰控制資料背後的基礎架構?資料如何向全球共享?資料的多個版本如何更新?不同區域的管理者指派給誰?資料能否成為像水、電、計算、網絡一樣高度共享的資源?
  2. 資料驗證。資料生成者如何證明資料是來自這裡?資料使用者如何能夠信任别人生成的資料?如何應對機器故障造成的資料錯誤?
  3. 變現。資料的所有權、使用權如何交易?如何打造一個通用的資料市場?

區塊鍊也是一種資料庫,具有三個明顯特征:

  1. 去中心化(每一個管理者控制一個節點,全體管理者共享控制權)
  2. 資料不變性(全鍊路各個環節均可用私鑰/公鑰/哈希進行資料驗證,能夠更有效的剔除“壞”資料)
  3. 天生的資産/交易屬性

是以,Trent認為區塊鍊能夠解決大資料目前面臨的挑戰——前提是區塊鍊技術要在可擴充性方面有所突破,能夠滿足海量使用者群的寫入、讀取、查詢需求。

當大資料遇到AI

我從90年代開始從事AI研究,當時最常見的研究方式是:拿一個資料集(一般很小,而且資料是固定的),設計一個能提升性能的算法——比如針對SVM的分類器設計一個新核心以減少AUC,然後把這個算法拿去發表。在當時,“可發表”的标準差不多是10%的提升。如果你的算法實作了2倍甚至10倍的提升,那就算得上是“最佳論文”了。

2001年,微軟研究員Banko和Brill釋出了一篇重要的論文。他們首先描述了自然語言處理領域在當時的狀态:通常以不到百萬數量的詞彙做為資料集,在普通算法(如Naive Bayes / Perceptrons)下有25%的錯誤率,在一些全新的基于記憶體的算法下能實作19%的錯誤率。然而這并不是重點。Banko和Brill的重要發現是:不改算法,隻是增加資料集——10倍100倍1000倍的增加,結果是錯誤率驚人的下降。在1000倍的資料量下,系統的錯誤率減少至5%以下。更驚奇的是在這個量級的資料集下,老掉牙的50年代Perceptrons算法的表現反而超越了那些基于記憶體的新算法。

2007年,Google研究員Halevy、Norvig和Pereira釋出了一篇類似的論文,描述AI如何在吞食了大量資料之後變得“不可理喻的高效”——在很多領域都是如此。

AI的競争,從此變成了資料量的軍備競賽。

回顧這幾十年的AI發展史,AI技術在最近幾年的發展速度是最快的,而資料量就是關鍵。

今天,無論是Google、Facebook,還是阿裡、騰訊、百度,都管自己叫做資料公司。無論他們是賣廣告、賣商品、賣理财、賣遊戲還是賣外賣,對他們而言,資料量就等于賺錢能力。這些在資料量儲備上遠遠超過了其他競争者的巨頭們,并不會希望被市場上的其他玩家掌握更大量級的資料。

然而對于資料收集能力有限的非巨頭玩家而言,資料共享可能會給他們帶來數倍體量的資料集,這會帶來顯著的好處。比如,如果各個銀行們将資料合并為一個資料集,則每一家銀行都能夠更準确的識别信用卡欺詐。如果能源公司與制造公司的資料能夠合并為一個資料集,則其中的每一家公司都能夠更準确的預測市場。如果全球四大鑽石鑒定實驗室的資料合并為一個資料集,則每一家鑒定機構都能夠更準确的為鑽石定價。如果保險公司能夠擷取這些能力,則也能獲得更大的收益。

當區塊鍊大資料遇到AI

以前由于安全問題,大家即使看到了資料共享的好處也不敢去做。而一旦區塊鍊大資料技術成熟,情況将有所不同:

  1. 去中心化的資料控制方式将促進資料的共享,不僅意味着更多的訓練資料(對AI而言意味着更好的模型),同時也意味着AI模型的共享。
  2. 更高效的資料驗證,減少了訓練資料中的壞資料,提升模型的可信度。
  3. 訓練資料與模型成為可以交易的IP資産。

AI從業者總是面臨一個挑戰:上哪兒去找資料集?以前的資料集大多數在網上七零八碎的躺着,隻有一部分比較完整的資料集收錄在幾個清單中,還有大量的私有資料集是我們擷取不到的。如果我們有一個全球化的資料庫來管理這些資料集呢?不僅有Kaggle,有斯坦福的ImageNet,還有無數其他的資料集。

有需要的話,就上IPDB看看吧。人們在這裡上傳自己的資料集,使用他人的資料集。資料集本身存儲在類似IPFS的去中心化檔案系統上,IPDB上儲存中繼資料用于索引。以後,IPDB上也許不僅僅有資料集,還可以有從這些資料集中建構出的模型。人們可以在這裡使用他人的模型,上傳自己的模型。

共享到區塊鍊上的資料本身具備資産屬性,可以直接交易與變現。這也可能成為一個資料共享的驅動力。事實上,今天的公共資料市場已經有十億美元的體量——一個有Bloomberg的1000倍那麼大的去中心化資料市場是完全有可能實作的。

現在已經有相應的區塊鍊技術可以把資料集與模型注冊為IP資産,簡單來說就是:

  • Coala IP協定
  • BigchainDB資料庫與IPDB資料共享平台
  • IPFS檔案系統配合Storj、FileCoin等硬體儲存設備

做為示範,Trent在ascribe給一個自己以前做的AI模型申請了“著作權”,得到了一張虛拟證書:

數字版權可以以非常具體的方式進行授權,如著作權、所有權、使用權、編輯權、分發權等等,這些權限在區塊鍊中可以相對容易的進行管理。就比如在DeepMind基于區塊鍊的醫療項目中,使用者就可以自己保有資料所有權,隻授予DeepMind使用權。

最後,别忘了還有AI DAO這種可能性,讓AI可以自行征用更多資源。

在過去,人類已經培育過去中心化的程式,那就是病毒。沒人能擁有它們,沒人能控制它們,沒人能關閉它們。它們隻是存在,試圖搞壞你的計算機。

今天,有了更好的API(智能合約語言),有了去中心化的存儲系統(區塊鍊),這些去中心化的程式将能夠做更多的事情。

通用人工智能——AGI,是可以自發行動的代理決策者(agent),是一種回報控制系統。控制系統是個頂呱呱的好東西。控制系統的數學基礎深厚,可以追述到1950年代Wiener的“Cybernetics”。控制系統與這個世界互動(通過傳感器與執行機),并适應這個世界(通過内部模型與外部傳感器來更新自己的狀态)。控制系統應用廣泛——恒溫空調、降噪耳機、汽車刹車、下圍棋的AlphaGo,這個世界到處都是它的身影。

AI DAO是一個運作在去中心化軟體上的AGI控制系統。它不斷的擷取輸入,更新狀态,調整輸出,并擷取資源以持續維持這個回報循環。

如上所述,AI DAO有很多可能性,其中包括增強AI自身的能力。比如,AI DAO可以發起“請求為我的資料做标記”的有償請求(智能合約),用低成本雇人來完善自己的資料集(去中心化的Mechanical Turk);AI DAO還可以發起“将你的資料給我”的有償請求,讓IoT裝置用自己的資料來交換電費。

Trent十分看好AI DAO的潛力。然而另一方面,Trent十分不看好AI與人類共存的未來。他說,很快就會有那麼一天,AGI的智能将達到人類的最高水準;之後又過了幾天,人類的智力在AI面前就會像螞蟻一般渺小。到那時候,人類已經無法控制AI,而AI自己會決定是否要對人類“友好”。

到那一天,人類與機器共存的唯一方式,也許是與機器同化?

原文釋出時間為:2017年1月9日

本文作者:楊賽

本文來源:

InfoQ

,如需轉載請聯系原作者。

繼續閱讀