天天看點

幫一百個國家建立模型 – Stability.AI争議CEO的野望

作者:MarsBit

原文作者:王超

原文來源:Empower Labs

3月23日,飽受争議的Stability AI CEO Emad Mostaque 宣布辭職,未來将全身心投入去中心化AI事業。這一消息引起了市場上不小的震動。

Stability.AI一方面曾獨自扛起開源AI的旗幟,為開源AI做出了重要的貢獻;另一方面又不斷被指責将其他研究團隊的成果攬在自己頭上。而CEO Emad虛假學曆的曝光和在社交媒體上頻繁的大話令其聲譽進一步受損。曾經擁有閃耀的投資人支援和巨額融資,Stability.AI卻早已深陷财務困境,命懸一線。

辭職後,Emad透露自己仍持有Stability.AI的大部分股份,足以控制董事會。他不是被迫辭職,而是認為在AI領域,權力的高度集中對每個人都是有害的,是以選擇辭職以促進Stability.AI的改變。由于Emad有着不光彩的吹牛史,大多數人都認為事情并不僅如此簡單。不過比起Stability.AI,我更想探讨Emad将要投身的去中心化AI。

幾周前,我與Emad一同參與了一場圍繞去中心化AI的讨論。之後我又整理了他過去關于這一議題的諸多發言,粗略的梳理出了他的視角。

誰控制了模型,誰就控制了思想

如果人類的行動是由作業系統驅動,AI正快速成為這個作業系統的外部核心元件。因為人類已經逐漸适應将思考負擔外包給AI,這個技術構成了我們思考方式的一部分。然而AI所帶來的便利和賦能,也伴随着顯著的風險——誰控制了AI模型,誰就一定程度上控制了這個世界的思想。

如果大衆對這些智能工具的工作原理和預設設定缺乏認識,我們的決策和觀點可能會悄無聲息地受到影響。AI模型的控制者可以通過設定特定預設選項,潛移默化地引導人們的選擇、觀點及行為。AI作為下一個時代的基礎設施,如果隻被少數商業團體所控制,後果可能是災難性的。這就是Emad所強調的,去中心化AI的重要性和迫切性所在。

每個國家都需要有自己的模型

當OpenAI投入巨大的精力在超級對齊(Super Alignment)項目時,誰來負責OpenAI本身和全世界每個國家,每個行業,每種文化的對齊?

沒有人。

OpenAI的Super Alignment在基礎安全和人類共同的倫理道德方面做出了很大的努力,但面對不同國家和文化的多樣性,這樣的努力是否足夠? 不同民族和文化往往有着與矽谷精英迥異的價值觀,而這些多元價值觀能否公平地反映到AI模型中?當像肯亞這樣的國家,他們的下一代學生開始大規模使用矽谷AI學習時,他們獨特的國家文化特色是否會逐漸消失?

答案很不樂觀。是以Emad認為每個國家、每個行業、每種文化,都應該擁有代表自己特色的AI模型。這些模型應該深深紮根于當地,充分吸收和展現這個國家、行業和文化的集體智慧。這個概念大家應該也不陌生,因為兩個月前英偉達也在各種場合講了主權AI的概念,本質上是一個東西。不過Emad早在一兩年前就開始在各種場合來講這個事,還是比英偉達早了很多。

這個世界上的絕大部分國家根本沒有能力建立自己的AI模型,而這恰恰就是Emad瞄準的市場。他希望通過建立一個底層堆棧來支援每個國家、民族、行業建立的AI模型。而在堆棧上,則希望用去中心化集體協作的方式來實作模型的發展。

Emad曾表示可能會啟動/孵化一系列的公司,每個公司會有不同的專業人才聚焦在不同的關鍵領域,如教育,醫療,金融,當然也包括針對不同國家的AI模型。而作為去中心化AI的實踐,這些公司更多扮演的是啟動器的角色。通過提供基礎模型、标準化的架構,來引入社群人才參與貢獻。如果能吸引到一個國家的大量優秀人才來參與貢獻,這些集體智慧最終會彙聚為一個優秀的國家模型。

核心是資料

用一個簡單的比喻,AI模型的配方就是算法和資料,然後用一些算力把它們攪拌在一起,資料越多,需要攪動這些資料的算力越大。目前市場上的絕大部分團隊都在追求更好的模型算法,拿到更多的資料,然後配以更大的算力。但實踐已經證明,如果資料品質高,用更少的資料量同樣能取得優秀的效果。換句話說,人們在通過堆算力給低品質資料擦屁股。

這構成了Emad推崇的去中心化AI體系的一個優點。他相信,如果能建立一個結構來引導一個國家的優秀人才共同參與,就能集結出高品質的國家資料集,同時這些資料可以做到可驗證、所有權清晰,并可以由此設計圍繞資料的激勵模式。

通過這種方式,我們能收集到過去根本接觸不到的資料。這些資料不僅品質更高,能更真實和公正地代表大衆的聲音和需求。

小模型叢集 vs 單一大模型

在AI領域,Scaling laws 幾乎成了一條鐵律,無論我們是否選擇追求它,都無法回避它。

很顯然,采用去中心化的方式來組織資源,再通過Scalling Law實作通用人工智能(AGI)短期内并不現實。在相當長的一段時間内,以社群為導向的AI模型也難以與像OpenAI這樣的巨頭競争,争奪最強大模型的桂冠。

然而,追求AGI和創造廣泛适用的AI是兩回事。随着技術的不斷進步,社群驅動的中小型模型正在迅速提升能力。預計一兩年之内,中小模型就足以勝任大部分日常任務。也許它不是最強,但它足夠實用,成本也足夠低,可以打開廣闊的應用場景。就像我們買的大部分網購并不需要用順豐隔日達一樣,模型的混合使用未來會逐漸主流化。

這就帶來極為重要的一個變化,當集體智慧驅動的模型被廣泛應用時,就大幅減少了單一大模型由單一機構控制帶來的潛在風險。如果大型模型的資料出現污染,這些基于集體智慧的模型也能輕松扮演校準器的角色,進行必要的糾正。這不僅僅是關于實用性和成本節約,更是集體智慧與AI上帝之間的博弈。

從技術角度看,小型模型也并不完全是劣勢。規模小使得他們更容易針對垂直領域進行額外的訓練。在這些領域内,盡管綜合能力可能不及大型模型,但它們能作為專家級工具發揮出色的性能。而一個由衆多專家模型構成的小模型叢集,在與單一大模型的競争中還真不一定會輸。

更加重要的是模型小能夠有效促進部署的去中心化。在談到去中心化時,我們不僅指的是模型的建設和資料來源的去中心化,還包括治理的去中心化以及部署的去中心化。如果開源模型能很友善的部署在個人的筆記本電腦甚至是手機上,這會構成AI平權。即使是中心化的服務提供者如果關閉了服務,使用者仍然可以依靠本地AI繼續操作。讓人們可以不受限的廣泛使用AI也是去中心化AI的重要目标。

AI + Web3 – 騙子還是未來

毫無疑問,Emad正在積極推動的去中心化AI計劃與加密技術密切相關。他已經表明要設計一種Web3協定,以整合并實作他的這些構想。這是因為AI領域目前缺乏的幾個關鍵元素——資料的可驗證性、資料所有權、大規模協調與激勵機制、以及集體治理能力——正是Web3技術所擅長的領域。

在這裡我想着重提一下治理。因為從來沒有一種技術像今天的人工智能這樣強大,并且即将廣泛且深入地影響世界的各個角落。誰應該決定這項技術的未來方向?誰能有效地掌控它?由少數公司如OpenAI的董事會來治理人工智能一定不是最有效的方案。簡單地由監管層對AI模型設定一些硬枷鎖也不一定能有效應對挑戰。集體治理可能才是真正的解決之道。

在Web3領域,集體治理的實驗正興盛發展,覆寫了資料治理、應用治理、網絡治理以及組織治理等多個層面。雖然大部分嘗試仍處于探索階段,也經曆了多次失敗,但這裡是人類治理發展的最前沿。

在過去的五年中,加密領域裡,特别是圍繞去中心化自治組織(DAO),人們幾乎嘗試了人類曆史上所有的治理模式。OpenAI采用的由非盈利基金會控制盈利公司的創新結構,在DAO裡早已經被廣泛實踐過。在我看來,Web3世界的人們在過去幾年就像是打了一場治理速通遊戲。人們在短短幾年内重新演繹了人類幾千年的治理曆程。

一個最常見的批評是大部分Web3治理不過是把過去人類已有的治理模式複制了一遍然後加上了個鍊上投票。不過曆史已經告訴我們,當擁有如此快的成長速度和很高的人才密度的時候,很快就會進化出全新的事物。

一個不那麼恰當的例子是網際網路廣告。記得網際網路剛剛興起的那幾年,打開新聞網站,一個巨大的全屏廣告會突然出現然後緩慢消退,而網頁上布滿了密密麻麻的廣告塊,這成了早期網際網路的标志性記憶。因為那時候人們并不知道什麼是更加有效的網際網路推廣方式,是以幹脆就是把傳統媒體上的廣告方式簡單搬到了網際網路上。然而随着場景的進步,随着人們對網際網路技術以及文化了解的加深,很快就進化出了人類曆史上從未有過的高效推廣模式,并迅速在網際網路上淘汰掉了傳統廣告。

在我看來對技術的治理也會走過類似網際網路廣告的路徑。區塊鍊技術帶來了大幅加強的協調和治理能力,人類曆史上從未有過的集體治理方案将從中生長出來,對此我充滿了信心。

寫在最後

放在當下去預測AI時代的未來以及審視Emad的全部構想,很難得出一個結論。顯然,他的計劃在許多層面面臨巨大挑戰。再加上Emad過去經常誇大其詞,區分他的話哪些可以當真,哪些隻是随口說說也不太容易。

然而探讨AI的權力結構是一個處于早期、又極其複雜且重要的議題。Emad和其他追求去中心化AI的同行們,他們的思考,他們所做的嘗試,雖然可能還遠未接近最終答案,但值得給予足夠的尊重和關注。這些探索雖然步履艱難,卻是開創未來的勇敢嘗試。這些努力,無論結果如何,都将成為曆史史詩中的一章。

也許有一天,這個世界會感謝Emad們。

繼續閱讀