天天看點

中國科技創新如何跑出加速度?

作者:星海情報局
中國科技創新如何跑出加速度?
中國科技創新如何跑出加速度?

我年少時遇到過一個非常風趣博學且經常引經據典的數學老師,她在課上給我們講過很多讓人印象深刻的數學發展史小故事,其中就包括了著名的“柯尼斯堡七橋問題”。

作為一個關注中國科技發展和前沿技術應用的作者,每年國内最重要的幾個科學技術獎項一直都是我關注的重點。我之是以在這個時間節點上,想起了這位老師和她的故事,源自于一張“2022中國電子學會科學技術獎”的獲獎名單。

這個獎項是由國家科學技術獎勵工作辦公室準許設立的,已連續評選了19屆,是國内電子資訊領域最高獎項,也一直被認為是國内電子資訊技術發展的風向标,獲一等獎及以上的項目,可以擇優提名中國國家科學技術獎的評選。

在今年公布的科技進步一等獎名單裡,就有一個叫做“大規模複雜異質圖資料智能分析技術與規模化應用”的項目。

中國科技創新如何跑出加速度?

這個項目引起我的注意,主要有兩個原因。一是這個項目所涉及的,正是現在科技界炙手可熱的“圖技術”,這是個大衆十分陌生,但在科技界已經成為各大巨頭們兵家必争之地的前沿技術,而且其應用早就已經滲透到了普通人日常生活之中。

二是這個項目,是由北京郵電大學和螞蟻集團等團隊合作完成的。它所代表的高校+民營企業的科研合作模式,在這些年越來越受到歡迎和重視,它代表着中國民營企業在中國科技創新領域正在成長、甚至已經成長為了一支極為重要的力量。

螞蟻集團對圖技術的研發也隻是這支力量的一個縮影,向其身後望去,看到的或許将是未來中國民營科技創新的星辰大海。

中國科技創新如何跑出加速度?

圖:了解世界的全新方式

現在的俄羅斯,有個飛地叫加裡甯格勒,位置在波蘭和立陶宛之間。

三百年前,這裡還叫柯尼斯堡,一條名叫普列戈利亞的河流橫穿這座城市,并将城市分割成了中心兩個小島和其他河岸陸地的布局,當地人為了友善交通,在河上建了七座橋。

在蘇聯還沒将這裡收入囊中之前,這裡曾是德國東部最著名的文化中心之一,也曾是條頓騎士團和普魯士的“龍興之地”。無數遊客與行人們穿行在這個忙碌而又繁華的城市,久而久之便有人在遊覽這裡時提出了一個問題:

一個步行者,要怎樣才能不重複、不遺漏地一次遊覽完七座橋,最後還能回到出發點呢?

中國科技創新如何跑出加速度?

這個謎題被提出後始終沒能解決,以至于一度成為了當地人十分熱衷的一項消遣運動,許多人曾聲稱找到了解決方案,但被要求按照規則再走一遍時卻都失敗了。直到1736年,29歲的天才數學家歐拉寫下了一篇名為《柯尼斯堡七橋問題》的論文。

他将每一塊陸地視為一個“點”,連接配接陸地的橋梁視為“線段”,将德國的“龍興之地”抽象成了一個簡單明了的數學模型,并将柯尼斯堡七橋問題提煉為了一個典型的一筆畫問題,最終得出了準确的結論:這是一個無法一筆完成的圖形,人們不可能不走重複路段并一次性遊覽完七座橋再回到出發點。

中國科技創新如何跑出加速度?

我每次想起這個故事,都深覺時間于人類科技傳承之間的美妙與宏大。

彼時,距離世界上第一台計算機的誕生還有兩百年的時間,做夢都不會有人能想到,歐拉的論文将要開辟的,是未來計算機科學領域最重要、最有趣,也幾乎是最容易被誤解的一個基礎理論體系:圖論。

更不會有人知道,三百年後,以圖論為基礎的圖技術,在今天這個百年未有之大變局的時代,将會成為整個科技界最前沿最受關注的風口技術,甚至成為再下一個百年裡科技競賽的兵家必争之地。

用Gartner在《2021 年十大資料和分析技術趨勢》報告中的預測來說,到2025年,也就是從現在開始到兩年後,圖技術就将會應用于80%的資料和分析創新。

今天大家對大資料、AI、算法推薦這些名詞已經熟悉得不能再熟悉了,而你今天聽到的幾乎所有用得到大資料分析和AI算法相關的應用,無論是支付寶的移動支付,還是抖音的算法推薦,亦或者精準地預測天氣預報、電網複雜的故障分析和保障、各大電商平台上的智能推薦,甚至是你在螞蟻森林偷個能量……

到兩年後,至少将有80%都是由圖技術在背後進行支撐的。

中國科技創新如何跑出加速度?

Gartner《2021 年十大資料和分析技術趨勢》

柯尼斯堡七橋問題的解決,成為了計算機科學發展史上一個重要伏筆。在英文中,圖檔是“image”,圖形叫“graphics”,而圖技術的“圖”與圖論的“圖”一脈相承,寫為“Graph”,它指代的是一種結構模型,一種以“節點”和“關系”解構和看待問題的系統。

在我看來,這是一種以“思維導圖”的方式了解這個世界的全新視角、全新體系。

柯尼斯堡七橋問題的解決過程,就是這種新視角最好的诠釋。歐拉将每一塊陸地視為節點,每一座橋梁視為連接配接這些節點的“邊”,這種模組化方式天然就關注“連結”和“事物之間的聯系”,而且對這種聯系的方向和屬性都有更出色的描述能力。

相比傳統的方式,以“圖”的結構形式來認識世界,尤其是認識事物之間的聯系,顯然更加直接和先進。

就拿社交平台的關系網絡來說,不知道大家有沒有在其他朋友的關注清單裡尋找共同好友的經曆,傳統的方式,是把兩個人的好友都列出來,然後尋找其中重合的部分。

中國科技創新如何跑出加速度?

而圖資料本身就是通過事物間的聯系組織的資料結構,是以想要尋找“共同好友”,甚至都不需要檢索,因為一切關系在圖上完全就是一目了然的,你隻需要定位就行了。

中國科技創新如何跑出加速度?

進入資訊爆炸的大資料時代之後,人工智能、機器學習開始越來越強調相關性和因果性。而“圖”這一資料建構方式,恰恰就關注,甚至基于相關性和因果性。這種資料結構幾乎天然就是為了AI時代而生的,它讓很多過去看上去十分複雜的問題,在這種了解世界的全新視角之下都變得迎刃而解。

中國科技創新如何跑出加速度?

圖技術裡的産業鍊未來

圖技術應用最典型的案例,是金融風控。

我早年做一二級市場并購研究的時候,有個私心覺得十分迷人卻也十分糟心的活,就是研究股權關系和資金鍊,其中很重要的一個環節就是研究擔保鍊。

比如A企業要貸款,說我找B企業擔保,B企業又找了C企業,C企業找D企業。D企業說好啊,但你一查,發現D企業可能又找B做了擔保。最後大家形成了一個閉環,這樣的擔保根本是無效的。風控就是要找出擔保鍊上的這類問題,避免把錢貸出去收不回來。如果用“圖”的方式來了解,其實就是在擔保的關系網絡裡尋找和定位“成環”的部分。

傳統的方式不是不能做,但排除風險所需要的時間和資源需求都很高,而且也沒有那麼準确全面,能力有限。比如有些銀行用 MapReduce 大資料處理的方法,但在企業擔保場景裡,它大概隻能找到長度為 6 的環,再長的就找不到了。

套現交易檢測相比擔保的場景對時效性的要求就更高,同時不僅時效性要求高,還需要綜合考慮多種資訊來提高檢測精度。因為在套現交易檢測裡雖然也需要識别閉環,但簡單地檢測交易閉環所得出的結果,往往是不夠精準的。

舉個例子,A轉賬給B,B轉賬給C,C再轉賬給A,這是一個交易閉環,意味着可能存在套現交易。

但如果A轉賬給B後半個月,B再轉賬給C;C再過半個月,才轉賬給A。這雖然也形成了一個閉環,但因為黑灰産作案需要考慮時間成本,是以在現實生活中這種情況往往不是在進行套現。

中國科技創新如何跑出加速度?

要更加确地判斷這類交易的性質,就需要在圖上融入時間資訊。這就是所謂的“動态圖”。

再比如,同一個閉環中,如果B是一個大企業賬戶,那大機率不會認為A->B的交易存在問題。但如果A/B/C之間本就互相認識,且都是通過線下掃碼支付進行的交易,那存在套現風險的可能性就明顯很高。

中國科技創新如何跑出加速度?

在圖上融入比如節點的類型(是否是大商家)、邊的類型(是否有社交關系)等資訊,這就是所謂“異質圖”的概念。

傳統方式尋找閉環本身已經比較吃力,更不要提在尋找閉環的基礎之上,還需要綜合考慮其他資訊。是以必須得做圖技術。

真實應用中的圖資料都很複雜,既包含動态性,又包含異質性,需要對這些特性同時進行模組化,才可以有更高的識别精度。

螞蟻開始研究圖技術,最初就是源于業務需求的驅動。2020年雙11的最高交易數是每秒58萬筆,在如此之高的并發下,要求在極短的時間内極高精度地檢測出風險,還要保障交易能夠按時完成,以傳統的形式幾乎沒有可能。是以一直以來有人說中國的移動支付能夠發展起來純粹得益于人口紅利帶來的高頻應用場景,缺乏技術含量,我都是極不贊同的。

在軟體界,越是易用、淺白,卻還功能齊全的軟體,就意味着越高的開發難度。支付領域也一樣,使用者越是能簡單、快速、便捷、安全地完成支付,就意味着背後需要越強大的硬核技術實力進行支撐。

拿這次獲獎的“大規模複雜異質圖資料智能分析技術與規模化應用”項目來說,北郵和螞蟻等團隊合作攻堅了十年,期間累計拿了43項國内外的發明專利,51篇CCF-A類論文等知識産權成果,還參與了2項行業标準的制定。

過程不可謂不艱辛,當然成果也不可謂不豐碩。

根據官方釋出的資訊,近兩年來,該技術項目已為金融、網際網路、通信、電力等行業的十多家企業節省了7億左右的成本。作為項目實踐案例的網商銀行“大雁系統”将核心企業上下遊的小微商家貸款可得率從30%提升至了80%。支付寶如今可以在0.01秒内完成對一筆交易的風險判定,2021年資損率小于億分之0.98——即平台上每1億人民币的資金流轉中,隻有不到1塊錢的損失風險。

人類社會的進步,本質建立在生産力提升的基礎之上,而生産力提升的本質則是效率的提升。二十年前一筆交易的判定可能要1分鐘,二十年後隻需要0.01秒,并且對上萬億動态的、異質的資料進行分析和識别,能支撐這種效率和精度提升的圖技術毫無疑問是未來推動社會進步和科技創新的一項重要基礎技術。

它的應用場景也不止在金融領域,在能源、交通、醫療領域也有大量應用。

比如天氣預報,其原理是将地球按照“經度-緯度-氣壓層”劃分成超100萬個小網格,并在網格上确定天氣狀态。一個網格天氣的變化,可能會受到很遠的網格的影響,預測天氣的難點就在于如何模組化如此大量的網格之間高效且稀疏的互動影響。

中國科技創新如何跑出加速度?

圖檔來源:相關論文

開發過AlphaGo的DeepMind和谷歌新研究出了一種基于機器學習的天氣模拟器GraphCast,這個模型用多尺度網格圖的方式模組化了這些小網格,利用了一個16層的圖神經網絡,即可實作局部和全局的資訊傳播,可以捕捉到比傳統方法更長的空間互動,進而極大地提高了天氣預測的準确率。

對未來于4至10天内天氣變化趨勢的預報,被稱為“中期天氣預報”,其準确性對于農業、建築業、旅遊業等行業的政策制定來說至關重要。目前GraphCast可以在60秒内預測未來10天内的天氣,而且準确率極高。

大型制造業比如半導體行業、新能源行業,也是圖技術應用的重要場景。這些工藝路線長,設計裝置多,參數複雜,産品資料量極大的産業,每一個環節和資料之間往往都有很複雜的關聯性,而圖技術特别适合處理複雜關系、發現隐藏的特殊關聯,不僅可以分析風險,甚至可以預測潛在的裝置、工藝、供應鍊風險。隻要是需要展現關聯性的地方,圖技術的處理方式就有時效性和精确性的天然優勢。

社交媒體和電商的推薦系統這些極為日常的場景,已經被圖技術深入滲透,在新藥研發、智慧交通、工業物聯網、傳統産業數字化更新改造層面,圖技術都有極為廣闊的應用前景。

中國科技創新如何跑出加速度?

民營企業的創新活力

“大規模複雜異質圖資料智能分析技術與規模化應用”項目,隻是中國民營企業和高校合作推動中國科技創新的一個縮影。

根據2020年資料,大陸的民營經濟貢獻了50%以上的稅收,60%以上的國内生産總值,和70%以上的技術創新成果。

2021年大陸全社會研發投入27900億元,其中76%來自企業投入;2021年國家重點研發計劃中的79%是由企業牽頭或企業參與的,而民營企業的投入還在增長,2021年,大陸企業研究與試驗發展(R&D)經費支出21500億元,比上年增長了15.2%。

我特意拉出了中國電子學會科技進步一等獎從2012年到2022年十年來所有的獲獎名單。早年間這個名單上獲獎項目的主要完成機關,大多是各大高校和相關專業的研究所,出現在名單上的民營企業則主要是一些通訊裝置硬體和服務的提供商,比如中興、華為等等。

而随着時間的推移,這個名單上開始出現越來越多各行各業的民營企業,阿裡、百度、騰訊、網易、奇安信、OPPO、TCL、海信、京東方、螞蟻集團……這些網際網路巨頭和各自領域的龍頭企業,都開始出現名單裡。

中國科技創新如何跑出加速度?

根據國家知識産權局知識産權發展研究中心釋出的《中國民營企業發明專利授權量報告》,截至2021年年底,研發投入前1000家民營企業的研發費用總額已經達到了1.08萬億元,占全國研發經費投入的38.58%,占全國企業研發經費支出的50.16%;同比增長23.14%,增速比全國高8.5個百分點,比全國企業高7.9個百分點。

中國民營企業500強國内外有效專利合計為633922項,較上年增幅53.60%。其中,國際有效專利134657項,增幅為474.65%。在《國家中長期科學和技術發展規劃綱要(2006-2020年)》指導下發展的近20年裡,正在湧現出越來越多源自民營企業的科技成果。

在不知不覺間,全球經濟競争格局已經發生了轉變,國家間的綜合國力競争,演變成了以科技創新為核心的發展競争。

卡脖子是一件很痛的事,這些年一直埋在每個中國人的心裡。但能讓人好受一點的是,這樣的國際環境,也進一步促進了中國企業自主創新意識的提升,迫使企業走上了國際科技競争的舞台。其中大量都是民營企業。

以前的很多技術空白正在被一點點填補起來,手機作業系統有華為的鴻蒙,人工智能我們也有了百度自主研發的深度學習平台,雲計算領域阿裡有着深厚的技術積累,新能源汽車領域從比亞迪到蔚小理,都已經走在世界前列。中國的民營企業正在成為大陸參與國際科技競争和掌握國際科技創新話語權的代表者,以超乎想象的科技創新活力,成為全球市場上不可忽視的一支力量。

結語

2011年,北京郵電大學計算機系教授石川因為一個契機,最早接觸到了圖智能技術中的重要概念,異質圖(Heterogenous Graph)。

這個概念最早由國際資料挖掘權威韓家炜和俞士倫在2009年提出。彼時,業内對這個概念的接受度還很低,一些該領域的奠基之作投稿頂會論文,也被拒了好幾次。

但好的技術會發光,石川不甘這樣的技術被埋沒,踏上了長達十多年的布道之路。後來,石川遇到了産業界做圖技術領先的螞蟻集團,雙方一拍即合搭建了科研小組。經曆過大規模工業級場景的考驗,螞蟻已對圖技術遊刃有餘,與學術界的雙劍合璧,催生出了開篇提到的圖智能研究成果,将圖智能水準提升到了新的層次。

圖這樣的技術,發展到一定程度就需要一個自身規模就夠大,應用場景就夠多的平台做舞台,才能進一步的進化疊代,這種事小型創業團隊很難做得了,過去二十年裡成長起來的中國科技産業巨頭們,就成了前沿技術大規模推廣應用的重要力量。

而還有更多的企業,雖然未必像大平台一樣能量巨大,但也逐漸成長為了産業鍊上的關鍵技術企業。

工業和資訊化部自2016年釋出《制造業單項冠軍企業培育提升專項行動實施方案》以來,共計公布了六個批次的“單項冠軍”評選結果,這些企業在細分産品市場中實作了生産技術或工藝的國際領先,共計848家“單項冠軍”裡,有400多家是民營企業。

去年我們盤點過中國航母相關的供應商,山東艦的配套機關一共532家,其中非軍工的社會配套機關就有412家,其中民企占了半壁江山。

我寫這篇文章之前,剛剛去二刷了《流浪地球2》,片子的導演郭帆經常被人調侃為全中國最會“化緣”的導演,拍球1的時候帶着個草台班子,拍球2就已經建立起來了一套完全屬于中國電影工業自己的标準化管理體系,實作了雲端的5G媒資管理和現場拍攝的直播推流。

5年左右的時間,試圖給中國科幻電影趟出一條路的《流浪地球》主創團隊,就從草台班子變成了現代化、工業化的電影制片廠,成為了中國文化先進生産力的代表。

而所有這些為人知、不為人知的公司,看得見、看不見的努力下,中國的民營企業已經成為大陸科研創新和社會進步的重要力量,爆發出超乎想象的科創力。

繼續閱讀