天天看點

創材深造創始人王軒澤:AI + 金屬材料:更适合産業落地的方向

編輯/凱霞

3 月 23 日,在機器之心 AI 科技年會上,創材深造創始人兼 CEO 王軒澤在「AI x Science 論壇」分享了主題為《AI + 金屬材料:更适合産業落地的方向》的相關内容。

分享就 AI 産業落地過程中可能遇到的問題進行了讨論,包括精度陷阱;行業壁壘并非技術,傳統大廠轉型自研;某些 toB 領域存在的一些問題;黑盒性質嚴重,客戶不認可,短期内取代不了關鍵崗位人員;算法效果驚豔但落地艱難等精彩觀點。

王軒澤介紹說,AI 賦能金屬材料的産業化,可以有效地規避或解決上述 AI 落地中的難點問題。從另一方面講,高端金屬材料是一個經常被忽視的市場,随着産業更新和戰略轉型,國産化替代的需求被迅速放大。高端金屬領域最主要的難點在于過長的研發周期和過大的研發投入,是以使用 AI 賦能新材料的研發成為了彎道超車的最優解。

創材深造創始人王軒澤:AI + 金屬材料:更适合産業落地的方向

https://www.bilibili.com/video/BV1SL4y177nR?t=7.0

以下為王軒澤在機器之心 AI 科技年會上的演講内容,ScienceAI 進行了不改變原意的編輯、整理:

大家下午好!非常感謝機器之心的邀請,非常高興能夠入選機器之心 2021 年度《最具潛力 ScienceAI 創業公司 TOP 10》企業名單。首先,簡單自我介紹一下,我通過計算機實體競賽保送到上海交大,在交大讀了本碩,主修人工智能方向。畢業之後去了科創闆 AI 第一股的虹軟科技,主要做的是圖像領域的人工智能算法,幫助國内外頭部的廠商做攝像頭内置的圖像算法落地。離職之後自己創辦了敏視科技,主要做工業檢測項目,取得了一些小成績。後來參與了一個 AI+小分子藥物的創業項目,具體算法架構都是由我來開發的。現在緻力于 AI+基礎材料的研發。我是一個創業者,同時也是一個比較資深的算法工程師,是以,很多年在一線從事這些 AI 落地的項目過程中,也是看到了一些 AI 落地的問題。今天這個分享也是希望跟大家分享一下我遇到的或者看到的問題,以及我們為什麼最終選擇了 AI+金屬材料的領域做深入的研究。

AI 落地過程中可能遇到的問題

不知道大家是否在 AI 落地過程中遇到過下面的問題。

第一,精度陷阱。因為算法發展得非常快,是以有一些領域裡面,算法公司投入和算法效果的提升,其實并不是一個一次函數的關系,有點類似于 sigmod 函數的情況。在算法發展到一定程度之後,想要提升它的性能需要投入非常巨大的時間、人力,包括精力的成本在其中。這些算法突破上限的難度在不斷地提高,同時由于算法的開源程度不斷加大,導緻算法的門檻在降低,導緻一些獨立算法工作者也可以利用開源網絡做一些項目。一些小型的算法公司針對特意化的需求點做一些調參、模型優化等工作之後,可以進一步地提升算法的效果。但是再想提升效果或者追求效果極緻化的話,就需要投入大量的成本,投入的成本是呈幾何性質的增加。而且投入非常大的成本之後,效果也隻是從 95% 提高到 97%,很多終端使用者并不能明顯感受到算法提升,導緻很好的算法公司,它的算法産品不會比同行或者行業裡面平均水準賣得更貴。最終導緻這些頂尖的算法公司算毛利的時候還蠻好的,一旦算到淨利資料就很糟糕,多年無法盈利。

第二,算法帶來的技術壁壘在不斷地壓縮。因為它的下限在提高,上限突破比較難,雖然區間越來越窄。在一些領域内,反而傳統的壁壘仍然是這個領域内的一些壁壘,比如供應鍊、管道、品牌、成本等等,這些壁壘反而仍然是這個領域内最核心的壁壘。同時,領域内的一些大廠具備這些壁壘的基礎上,自己也在做轉型,應用新技術和 AI 技術賦能自己,做他們的産業化更新,這樣就會對人工智能的創業公司就會比較難。我之前做圖像算法的過程中也遇到過這種問題。現在的圖像比較好的手機廠商都有一些自研的團隊,很早之前我們都會覺得這些團隊不堪一擊,但是越來越發現他們的成長速度越來越快,而且競争力也越來越大,這可能也是行業裡面的問題。

第三,對于某些 to B 領域。感覺上任何商業模式都有一些問題,比如平台型公司,它比較大的問題在于它想做到每一個市場細分情景的點上時,很難做到極緻化。一些平台型公司用通用型的檢測網絡,能覆寫到的場景點十分有限,即使覆寫到了這個場景點,如果在專門的場景裡面建立一個特意化的網絡,對它進行調參和細節調整的話,性能是遠遠地高于通用性的平台、通用性的網絡性能。這可能是平台型公司某些領域内的一些問題。

服務型公司比較大的問題在于,它的成長模型沒有平台型公司或者産品型公司那麼好,可能類似于線性成長的情況。盡管接的訂單裡面的核心算法是比較類似的,但是在絕大部分領域内,每個訂單的差異性還是很大的。服務型公司想去擴充更大的規模,擴大銷售額,或者再有更大的市場占有率,它不得不接很多訂單,又會投入很多成本。一旦後續訂單接不到的話,可能會對公司整個發展有一定營運上的壓力。同時這些服務型公司,尤其在國内工業領域的一些客戶,它很難把自己最核心的技術、核心資料和需求提供給這些服務型公司,畢竟是核心機密,這就會導緻服務型公司永遠積累不下來很核心的資料和産品。之前聽說過一些創業者有一種想法,先從服務型公司做起,接一些訂單,從訂單中擷取需求,做成一個産品,再去做銷售。聽起來很美好,實際上會遇到很多困難。

現在很多公司,自己在做産業化落地轉型,有點類似自己用技術造出了一把礦鏟,然後自己用礦鏟去挖礦,這種相比于平台型和服務型公司更好一些,但是也會面臨一些挑戰。關鍵點在于每個領域的核心不同點會導緻有更多挑戰。做産業化轉型的過程中,選擇一些比較好的領域是更關鍵的事情。

第四,黑盒性質嚴重,客戶不認可,短期内取代不了關鍵崗位人員。人工智能尤其是深度學習網絡黑盒性質比較嚴重。很多客戶不太接受、不太認可。尤其是安全相關的領域,比如化工安全。化工安全一旦産生安全事故,它是非常嚴重的,甚至一個安全事故會導緻幾十億的化工企業煙消雲散。化工安全要落實到人,問責到人,如果用一個黑盒形式的人工智能網絡代替掉整個專家系統或人的評判标準,或者一套邏輯評判标準,就會有問題。最終一旦發生問題,問責到人,發現是一個黑盒性質的網絡,怎麼得到的結論也沒人知道,這是完全不可接受的。

是以,大多數領域會怎麼做呢?在原有的一套人的系統基礎上,再搭建一套備援的基于神經網絡的系統,這樣也會帶來一些問題。比如,它并不能節省勞動力,并不能減少成本,反而會增加成本,因為要重新搭建系統。同時,在一些其他領域比如智能駕駛、遠端醫療等領域,即使我們的安全系數達到了可用的程度,教育客戶的成本也是非常昂貴的。比如智能駕駛,它已經宣傳很多年了,即使再過幾年讓這些駕駛員把手松開,從方向盤上解放出來,在駕駛室上睡覺,也很少有人能做到這一點。

第五,算法效果驚豔,但落地艱難。比如聯邦學習,它在跨場景建構生态環境中非常困難,比如前段時間比較火的認知智能,很難擷取一些高品質的标注資料。資料也是在某些領域内人工智能落地的難點問題。比如工業檢測。有些鋼闆的缺陷,産線不斷運作中,一年隻能産出幾個甚至十幾個缺陷,怎麼收集它的資料,這很難。我們隻能通過半監督的方式,或者傳統算法的基于邏輯的識别能力對它進行判斷,但是這肯定沒有用大資料訓練的方式好,性能、效果都會差别很大。還有 DeepFake,你很難想象它有怎樣合規的落地場景。

AI+金屬材料,更适合人工智能落地的應用場景

如果大家遇到了這些問題的話,不妨将目光轉到 AI+金屬材料領域。為什麼我覺得 AI 金屬材料更适合人工智能落地的場景呢?因為它本身有一些特點,最重要的特點是,它的研發周期非常長,但是驗證周期很短。傳統金屬材料的研發動辄幾年、十幾年、幾十年的周期,類似國外的高端金屬材料公司都是一戰、二戰的老企業,可能經過了幾十年、上百年的積累才沉澱下來的研發技術。而一旦金屬材料性能達标則可以快速進入生産銷售階段,可以為公司帶來比較大的盈利。是以金屬材料最核心的痛點在于研發,而人工智能在其中能起到的作用是,用人工智能的技術在整個金屬研發階段有颠覆性的新模式,解決掉了長周期研發的難點問題,一旦用 AI+金屬材料解決了研發的問題,後續的一些問題,其實相對來說比較簡單。

國内也是有很多案例。比如很多公司都是把原有的技術獨立出來做了一家企業,這家企業自己做生産銷售,進而上市,取得比較好的效果,比如鋼研高納、西部超導和鉑力特等。是以這個路徑非常可行,同時,我們最終給終端使用者提供的并不是一套算法和解決方案,而是最終的産品、零部件,或者一款材料,這樣可以有效地解決人工智能黑盒、客戶不認可的問題。

近年來,一些新的制備技術、金屬先進技術也會讓落地化應用更友善。比如 3D 列印技術,可以說,不需要組建幾百人的工廠流水線,幾十個人負責幾十個 3D 列印裝置就可以實作幾十個億的産值了,而且也不會有排放、污染的問題,這是比較好的落地化場景。

在資料方面,近年來資料的積累已經可以支撐我們做人工智能的加速研發。主要從 2011 年開始,中美相繼提出材料基因工程,當時可能沒有這些 AI 技術,但是大家都已認識到資料是非常寶貴的,不管是企業還是研究院所都在不斷地積累資料。

在近一兩年來,金屬高通量制備技術得到快速發展,也進入了成熟階段,可以讓金屬擷取更容易,更低成本,足夠支撐人工智能技術在金屬領域内取得一定的突破。

我們在今年上半年會組建一個高通量的實驗室,之後會不斷地産出高品質的金屬資料,自己做研發。

在市場層面,也有非常大的市場需求。金屬領域是一個經常被人忽視的市場,一提到金屬領域,大家就會覺得這是低端産能,白菜價、利潤率很低、控制成本、壓縮成本等等,的确對于一些低端金屬材料是這樣。但是很多高端的金屬材料仍然被國外卡脖子卡得非常緊,高端的金屬材料市場非常巨大,超過是十萬億級别美金的市場,每年中國也會進口大量的高端金屬材料,因為國内制備不了。同時現在的國産化替代的需求也是非常旺盛,政府在一些核心領域内甚至明确要求必須要有國産化替代率,而且是逐年提升的,在政府的政策和國家規劃中能夠明顯感覺到政策在向這方面傾斜。比如 2021 年科技部的 6+1 的重大專項,那個「1」就是材料資訊學,也就是人工智能+金屬材料,這可能就是需求端。

對于供給端, AI+金屬材料最核心的幾項技術,都剛好在這段時間内進入了成熟階段,包括人工智能技術、金屬高通量實驗制備技術、3D 列印技術等,這些技術剛好都到達了技術高點,在向産業化落地轉化的勢能頂點的階段。

人才方面,今年國内第一批材料資訊學博士畢業,大概兩三年内會有幾百個博士碩士釋放出來,現在AI+金屬材料現在已經是材料領域最火的研究方向了。是以,這是 AI+金屬材料最好的時機。

創材深造,AI 賦能金屬新材料研發

下面介紹一下人工智能如何賦能新材料研發,創材深造是如何做的。

一般來講,金屬材料研發模式分為四個階段。第一個階段是經驗學科,試錯偶遇法。第二階段,是在第一階段的基礎上,通過大量實驗總結出了一些實體模型和實體規律,指導我們的實驗。第三階段是計算機興起之後,把這些實體模型放到計算機裡面,用計算機疊代仿真模拟計算,進一步提升研發速度。第四階段,即第四範式,就是現在用的材料資訊學,通過大資料的方式,揭示材料更本質的東西。為什麼第四階段能做到前三階段做不到的一些事情,因為前三階段都是基于實體模型做的仿真模拟。這個實體模型怎麼來的?是通過一些科學家長時間的積累,抽象出一個近似的實體模型,因為金屬材料和其他材料不同點在于,金屬材料要的是宏觀的性能,在制備過程中不可避免地會引入一些擾動。比如進入了兩三個氧分子,包括溫度場分布不均勻,這是不可避免的,是以這些公式沒辦法拟合高備援度實際發生的實體現象,是以誤差非常大,大到不可接受的情況。第四階段通過超高備援度的神經網絡對實體模型和過程進行拟合,誤差小得多得多,已經是可實際操作的階段了。

通過組織圖像找到的是成分和工藝的對應關系,當然我們不是隻用人工智能算法去做,我們是一個系統工程,我們也會用 DFT 的算法、材料計算的方法,把算得比較準的特征量作為網絡輸入參數輸入網絡,提升效果,大緻是這樣的邏輯。

材料會對人類社會形态發生巨大影響,材料已經發展了幾千年,但是我們實際上所探索的領域非常非常有限。

以三元合金舉例。我們探索的 90% 以上都是低熵合金,這個元素可能占整個合金裡面 80~90% 以上,其他所有元素加起來可能隻有 10% 不到。而中熵和高熵合金探索非常有限,2004 年,高熵合金這個概念才被提出,2010 年才有一些科學家去探索這個領域,是以我們有更廣泛的未知的領域讓我們探索。為什麼高熵合金這麼久沒人探索?原因在于傳統的方式想探索這種高熵合金範圍波動非常大,花費的代價遠遠高于低熵合金。如果用傳統方法探索高熵合金,估計要很多科學家積累幾代人的經驗才勉強能提煉出比較有限的實體模型。但是現在用第四範式的人工智能方式去研究,我們隻需要積累大量的資料之後,用人工智能的方式去找到成分工藝到性能的對應關系。找到對應關系之後,可能科學家反而能通過 AI 算法得到的結果,提取出更先進的材料學的原理出來,但是以後材料學的發展,很有可能會變成這樣一個模式。

創材深造創始人王軒澤:AI + 金屬材料:更适合産業落地的方向

我的分享到這裡。再次感謝機器之心的邀請,謝謝!

另外,我們最近正在招賢納士,如果各位小夥伴感興趣的話,歡迎加入我們!我們亟需材料學和人工智能的人才。

發履歷或者一般交流都非常歡迎!

人工智能×[ 生物 神經科學 數學 實體 材料 ]

「ScienceAI」關注人工智能與其他前沿技術及基礎科學的交叉研究與融合發展。

歡迎關注标星,并點選右下角點贊和在看。

繼續閱讀