天天看點

深度KWeaver:價值驅動,認知智能走向開源共創

文|智能相對論

作者|葉遠風

在底層硬體創新之外,軟體創新對提升中國前沿科技競争力同樣重要,這其中,開源的必要性毋庸置疑。但是,在全球範圍内開源項目碩果累累的大背景下,中國開源過去的發展卻不夠快,直到最近幾年才開始發力與加速。

這個過程,有大廠的宏觀布局,也有垂直領域的創新企業的積極參與,整個市場的熱情已經被點燃。例如,不久前全域資料能力服務商愛數正式開源了其認知智能開發架構“KWeaver”,這個産品脫胎于愛數的AnyDATA Framework 2,通過資料+AI,推動領域認知智能。

深度KWeaver:價值驅動,認知智能走向開源共創

但是,KWeaver并沒有采用全套高舉高打的方式,愛數低調務實同時又信心滿滿,這背後,或也反映出中國開源項目内在的價值驅動要求。

政策驅動表象下,開源藏着價值驅動的裡

基本上,能夠叫得上名号的開源項目,無論是業界還是普通大衆,對其印象往往都是大量的推動政策,背後的商業公司投入一系列資源,讓項目有更多的參與者、更好地參與其中,加速項目的發展。

典型如,華為在新計算産業的代表昇騰AI,其全棧體系中的開發架構MindSpore開源兩年,華為不斷從高校人才合作、創新賽事、大模型産業關聯(MindSpore在大模型訓練上有特殊優勢)來推動MindSpore的發展,意圖更快地向Google TensorFlow靠攏。

此外,華為開源的伺服器作業系統歐拉(openEuler)脫胎于過去其自用的EulerOS作業系統,在推動項目發展過程中,華為不斷動用自身的産業資源優勢,通過新計算架構的生态鍊建構來吸引開發者,推進歐拉社群的活躍度。

類似的還有百度在飛槳開源後,幾乎年年都舉行大規模人工智能産業創新大賽,除了提供豐厚的獎勵,還邀請行業内的創投機構作為評委提供開發者将項目落地的機會。

還有更多開源項目都是如此,給人的印象都是一套技術基座配合開發者共創工具、模型、産業案例與實踐經驗,然後要給予大量政策支援,對接産業需求、建立産學研用正循環,把火燒旺。

但是,這些可能隻是表象。無論什麼開源項目,能夠有起色最根本還在于其背後的商業價值或社會價值。

MindSpore、飛槳開源能夠走下去,核心在于當AI進入工業化大生産時代,需要批量出産AI應用的時候,一個優質AI開發架構填補空缺十分必要,享受更便捷的開發架構是AI開發企業、産業夥伴的共同追求。

歐拉開源項目的發展,更是因為中國伺服器作業系統嚴重空缺,而世界範圍内那些傳統的作業系統存在各種與當下計算需求(尤其是異構計算)的不比對,這時候,尋求計算能力突破、數字化變革的企業們,迫切需要一個更高效和便捷的伺服器作業系統。甚至,随着這種需求的進一步發酵,歐拉還在成為整個數字基礎設施的作業系統,與鴻蒙在物聯網終端的落地打起了配合。

深度KWeaver:價值驅動,認知智能走向開源共創

在中國開源項目亟待快速發展的今天,毫無疑問,這樣的價值核心才是開源項目能夠高品質、快速發展的根本所在。

換句話說,如果是一塊石頭,怎麼燒,火都是燒不旺的。

回過頭來看,KWeaver這類項目的出現,也在基于價值驅動的内在邏輯,也是人工智能發展到認知智能解讀的必然。

人工智能有兩條線,感覺智能與認知智能,目前無疑認知智能是熱點,而領域認知智能是認知智能在各個場景下的不斷垂直細化。領域即業務,用簡單的話說,領域認知智能就是讓組織擁有與人一樣的“智商”,能夠在吸收大量資料和資訊後對外做出有邏輯的判斷、推理,幫助組織解決特定的業務問題。

随着數字經濟的發展,隻會刻闆“看數字”的業務能力已經無法滿足組織的需要,能夠“了解”和“解釋”業務,通過資料做系統性的推理、規劃,才能更好地幫助組織發展,這是資料驅動型組織的本質。這種實作了人類獨有認知能力的領域認知智能,對推動數字化轉型、解決業務痛點、實作降本增效有直接的價值。

KWeaver的推出,仰仗的就是這樣的價值,也必須有這樣的價值。

例如,KWeaver孵化自愛數三年的産品積累,其背後的 AnyDATA已經建立起了系統的資料編織到知識網絡建構,再到認知推理分析的體系。在某智慧城市,建構了一套基于産業經濟學理論的五維産業鍊模型,通過内外部資料融合,結合産業鍊推理分析場景,幫助區域實作從産業鍊精準招商、主動企業服務優化營商、内外部關聯産業與經濟分析,完全通過資料和業務關系網絡來輔助區域産業布局、招商引資、數字化營商新模式。無論是政府數字化轉型,還是企業數字化轉型,愛數已經建構起來了數字化的認知模型:

  • 定目标:從戰略目标拆解到業務流程結構;
  • 深觀察:通過系統和資料觀察業務狀态;
  • 反思優化:通過名額對比與風險監控發現問題,通過知識網絡定位根因,再形成優化路徑;
  • 決策執行:最終形成認知分析報告和建議,指導數字化優化和執行。

認知智能是人工智能的下一程,領域認知智能的發展,讓這個賽道上的開源項目有了價值支撐—在很多有價值的技術領域,新的開源項目可能已經在路上。

開發者、企業、行業,開源的價值還必須走向多方共赢

具體到不同的主體,開源項目又需要有不同的價值展現,任何一方無法獲益,項目将最終無法走下去。

1、 對開發者,商業或社會價值帶來最終的參與内驅力

參與到開源項目的開發者,包括專注于技術的開發人員,或者産業鍊中的客戶企業等,項目帶給他們的價值是參與到社群的最終内驅力。如果一個項目隻是給予各種政策而缺乏實際的價值産出,很容易浪費資源甚至淪為“騙補貼”的遊戲。

歐拉的快速發展,得益于衆多參與項目的企業都能夠開發出自己的商用版本,共享一些便捷的技術能力,例如作業系統廠商可以做出更加适合市場需要的版本,服務于其客戶。

深度KWeaver:價值驅動,認知智能走向開源共創

而KWeaver同樣如此,想要通過AnyDATA推動認知智能的企業,一方面能夠共享到許多技術方案,另一方面也能夠通過開源将KWeaver內建到自身相關的系統中,做更智能的搜尋、建設自己的認知中台等。

另外,開發者通過愛數的平台,還能實作諸如資料交易、知識變現等價值。

2、對企業,帶來新興領域發展的杠杆效應

在商業市場上,開源對主推項目的企業而言,至少要實作三種價值中的一種:培養使用者、确定行業标準或者獲得商業價值,否則開源項目就會失去往往是最大的技術支援來源。

以KWeaver為例,其對愛數而言,是在領域認知智能領域以技術共享的方式快速培養使用者,并通過算法開源一定程度上确定行業标準,最終在領域認知智能全面開花後,憑借自家的AnyDATA産品擷取對應的商業價值,實作三者兼顧。

深度KWeaver:價值驅動,認知智能走向開源共創

實際上,這些價值背後,開源項目通過更多方面的參與,讓企業能夠撬動發展的杠杆,讓更多人共享也就是讓更多的人參與,加速技術創新——KWeaver讓領域認知智能在各種細分領域都有對應的開發者,完成愛數一家企業無法完成的全領域認知智能,推動領域認知智能在全場景的落地,在這個過程中,愛數隻需要做好底層技術服務、做好标杆領域示範即可。

3、對行業,根本上改變技術和産品發展的軌迹

衆人拾柴火焰高,開源的一個重要價值,是在行業層面推動技術的快速演化,尤其是在全球化的力量參與下,更快實作技術進步、行業崛起,這種價值讓整個行業有更好的發展前景,也才能支撐開源項目一直走下去,這其實是一個類似于推動“朝陽産業”發展的過程。

MindSpore、歐拉背後,新計算産業快速發展,帶來了廣闊的市場機遇,反過來又讓開源項目越來越有期望,更多的加入者、更好的前景,一步步滾雪球。

KWeaver也是如此,其開源讓領域認知智能獲得全球化的參與力量,不再隻有愛數一家企業推動,讓人工智能中的認知智能能夠以垂直細化的方式全面落地。在這個過程中,更多的企業也将獲得普惠化的認知智能,使認知智能走下高高的神壇,以垂直化的方式深入千行百業,營造出廣闊的發展前景。

價值驅動的同時,開源項目還要完成“底色”的描繪

當然,開源項目在價值驅動的同時,一些必要配套工作也必不可少,科技大廠們那種大量資源投入的政策做法可以看作是這方面的代表,但從KWeaver來看,還有兩個方面的動作必須完成。

一是在更高代碼品質要求的情況下,能夠源源不斷輸入優質技術能力。

越是初期,來自項目主推企業的技術支撐就越為重要。一個AI開源項目最開始被貢獻出來的代碼品質奠定了開源社群的“品質”基調。

2019年立項,2021年1月釋出1.0版,2021年正式走向商業落地,2022年3月正式釋出AnyDATA 2.0……在KWeaver走向開源前,愛數已經在AnyDATA上進行了3年多的打磨,保障了開源項目最基本、最核心的技術能力。

深度KWeaver:價值驅動,認知智能走向開源共創

目前,KWeaver提供有可視化的知識網絡工作台,可視化的認知智能應用開發調試工具,豐富的資料加工及模型訓練工具,以及所見即所得的API文檔等。這背後,還離不開愛數十多年精益研發經驗,對代碼品質的把控,在各種測試上的有效覆寫,才能有底氣做開源。

二是開源的态度建設,越開放的心态、越少的限制,越能夠激發開發者的熱情和創新能力。

基本上,越是成功的開源項目,在對開發者的限制上就越少,甚至“放任自由”。與此同時,越是早期的開源項目,對開發者的“放任”就越能帶來更積極的結果。

KWeaver選擇了Apache license 2.0作為開源許可證,原因可能就是如此。這是一個比GNU、GPL、BSD等常用許可證更加自由的标準,幾乎對開發者不加以限制,可以自由利用代碼。

深度KWeaver:價值驅動,認知智能走向開源共創

事實上,KWeaver的出現還帶有普惠技術賦能産業的色彩,人人都可以在 GitHub上擷取代碼,其源代碼開源且技術透明,任何參與項目的使用者都可以檢視全部技術細節,同時還支援多元異構資料源對接,提供SDK相容更多的第三方知識抽取模型,提供 API和 Web元件的整合方式,幾乎是全方位的自由。

總而言之,中國開源項目任重道遠,但遵循價值驅動的邏輯,随着各大開源項目尤其是AI開源項目的釋出,這個程序正在加快。在一開始就盯住價值的情況下,這些開源項目也鎖定了長期的發展潛力,為中國開源項目帶來更多可能性,在全球軟體創新競争中獲得更多優勢。

*本文圖檔均來源于網絡

此内容為【智能相對論】原創,

僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、複制或建立鏡像。

部分圖檔來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。

•AI産業新媒體;

•澎湃新聞科技榜單月度top5;

•文章長期“霸占”钛媒體熱門文章排行榜TOP10;