天天看點

企查查全球首發商查大模型“知彼阿爾法”,助力建構安全可信人工智能

作者:财經雜志

近年來,人工智能成為全球數字技術創新最活躍的前沿領域之一,是數字經濟的新賽道和國際競争的新熱點。同時,社會公衆對于人工智能疑慮未消,在踩下油門的同時如何控制好速度與方向,進而建構安全、可信的人工智能産業生态,探索基于可信資料的AIGC(生成式人工智能),成為人工智能未來突破的一個重要方向。

7月3日,企查查釋出全球首款商查大模型——企查查“知彼阿爾法”。這款大模型是基于企查查在商業查詢領域近十年可信資料積累後進行大規模預訓練的成果,後續将上線的創新産品通過大模型+企業信用資料庫共同建構,用AI技術賦能企信大資料創新,打造安全、可信的人工智能産品,為使用者提供更加便捷、精準的商業資訊查詢服務。

企查查全球首發商查大模型“知彼阿爾法”,助力建構安全可信人工智能

(圖:企查查商查大模型“知彼阿爾法”)

業内首款商查大模型為何會是企查查?

企查查創始人陳德強表示,企查查擁有覆寫全球近5億家企業的企信資料庫。商業資訊查詢服務最核心的資源就是相關的資料資源,比如工商資訊、訴訟資訊等。并且,資料覆寫面要足夠廣泛,不僅要有中國的全量資料,還要有全球其他國家的資料。此外,在企業标訊、企業盡調等專業性很強的領域,還需要建立專門的資料庫。要将AIGC技術引入商業資訊查詢服務領域,最關鍵的動作就是用企信資料集來訓練相關模型。資料量越大、資料品質越高,最終訓練出來的模型才越精準。相對于目前其他大語言模型主要用公開的網際網路資料集,工商、司法等專業資料的擷取難度更大。可以說,企查查所覆寫的5億家企業征信資料資源是企查查商查服務最核心壁壘,彙集了目前國内市場中的80個産業鍊,8000個行業,及海量的市場實時工商資訊、風險公示、知識産權、征信報告、股權關系等300+次元的企信資料。這些資料,不僅為企查查建構了較高的競争壁壘,也為其訓練知彼阿爾法商查大模型,奠定了堅實的資料基礎。

據了解,企查查的AI算法模型國内領先,在今年5月獲得”中國智能科學技術最高獎”吳文俊人工智能科學技術獎。在算法層面,企查查有着深厚的AI技術積累,多年來,企查查通過運用深度學習、自然語言處理(NLP)等AI技術,現已實作在海量全球多語言文本中進行自動化、智能化的資料分析與文本挖掘,并能進一步實作深層次語義分析,為使用者提供更精準的語義檢索服務。在預訓練模型領域籍由豐富的資料資源,企查查已經有較強的技術積累,本次企查查釋出的知彼阿爾法商查大模型實作了完全自主知識産權。

豐富多樣的産品服務與應用場景。使用者直接面對的是産品,而不是技術。是以,要想将AIGC底層的大模型技術應用于商查服務,就必須要将技術封裝成便于使用者使用的産品。而且,針對不同的使用者需求,要建構針對性的産品,進而形成相對完備的産品矩陣。以産品矩陣的方式,來為商查使用者提供一站式服務。在産品層面,企查查針對不同使用者群體,建構了完善的産品矩陣,具體來看:對于企業使用者而言,企查查通過定制化服務提供精準拓客、企業評級、盡職調查、風險控制、司法調查、輿情監控、供應鍊管理等場景的解決方案,輔助企業使用者完善企業畫像、資訊交叉核驗、尋找合作夥伴;對于個人使用者而言,企查查通過雲平台綜合多元度資料提供投融資、求職招聘、風險判定等場景的解決方案,為個人使用者透視企業股權架構,規避企業識别過程中的信用風險;對于公共部門使用者而言,企查查資料既是央行官方征信管道的重要補充,也是地方政府政策制定、社會信用體系建設、招商引資、篩選政策扶持對象、進行企業信用監管重要參考。

為什麼要打造商查版ChatGPT?

伴随着資料量的積累以及産品功能的增加,商查領域出現諸多問題和需求痛點,主要表現在兩個方面:

使用者還停留在關鍵詞搜尋階段,平台還不能很好了解使用者複雜的業務需求。目前大部分商查平台本質上就是企業信用資訊領域的搜尋引擎,使用者通過關鍵詞,在企信資料庫裡搜尋對應的企業或者風險資訊,很難表述出使用者複雜、結構化的需求。比如:某學校食堂招标過程中希望了解供應商的食品安全風險,用此前的商查産品一般是先輸入參與投标的公司名稱,然後跳轉到到對應公司的首頁面,再通過查找該公司“經營風險”中行政處罰或“經營資訊”中的“食品安全”内容,才能确定該公司是否存在食品安全風險,步驟繁多,且對新使用者并不友好。如果使用者還想知道該企業法人經營的其他餐飲公司是否有過重大安全事件?本次投标是否有關聯企業陪标?類似這些更深入的需求,簡單的檢索資訊就很難快速滿足使用者。即使能實作需求,也需要使用者本身具備相關的專業知識,并能熟練掌握商查平台各項搜尋功能,經過多步相對繁瑣的操作,最終才能得到關于該企業更深入、完善的資訊。但這對于絕大多數新使用者而言,使用門檻過高,不利于在更廣泛的範圍内打通資訊通路。

此外,搜尋引擎模式,商查平台回報給使用者的是大量基礎資料,而不是直接的答案。如果是大型集團公司,則可能有成千上萬的基礎企信資料,如此巨大的浏覽量對于使用者而言是一個不小的負擔。這樣的商業資訊查詢服務,還停留在工具階段,不能稱之為強大的商業助手。同時,企查查擁有查企業、查老闆、查風險、查招标、信用大資料、風險大資料等數百類産品服務,使用者很難系統學習掌握,基于知彼阿爾法大模型,企查查後續将上線的對話産品,則可以跳過繁瑣的檢索步驟,用對話的方式充分釋放企查查各項産品能力,為使用者提供「有整體性的、易于了解的、具備高價值的」商業資訊服務。

而使用者如果使用ChatGPT等大語言模型搜尋高價值的企信資料時,會發現明顯的問題:由于缺乏專業的資料庫支援,通過ChatGPT搜尋的企業工商、信用資料皆來源于公開的網際網路資料,無法保證資料的準确性,與此同時,一些高品質、商業化的企信資料庫并不對其開放。缺乏專業資料庫的支援,ChatGPT等大語言模型在商查領域的分析都是“無米之炊”,甚至出現“無中生有”的狀況。而知彼阿爾法商查大模型則是基于企查查全量可信資料進行的深度訓練,可為使用者提供專業的企信資料,及多樣化的分析結果。

AIGC+企業信用資料庫,商查服務方式再進化

随着人工智能步入“AIGC時代”,陳德強認為,這将徹底改變資料的查詢和使用模式。“行業資料規模達到了一定量級後,資料查詢方式發生了變化,AIGC+企業信用資料庫,可以把資料完全利用起來。”據介紹,企查查目前釋出的知彼阿爾法商查大模型是全球首款商業查詢大模型,該模型基于企查查覆寫的全球企業信用資料進行訓練,相較于傳統商查平台,後續基于知彼阿爾法商查大模型建構的産品實作了以下三個方面的變革:

人機互動方面實作運用自然語言對話,即能完成複雜的查詢步驟。使用者要查詢某項商業資料,不再局限于關鍵詞搜尋,而是可以用一段自然語言的描述,來提出自己的需求,降低使用者門檻。例如,當使用者想要對某公司進行淺度盡調時,可以提出“某公司行業地位怎麼樣?有哪些競争對手?”知彼阿爾法大模型會從使用者的描述中了解其需求,并将需求“解構”成對應的指令。這種方式,當使用者在了解一家企業時,面對的知彼阿爾法大模型就像是一個專業的商業調查助手,而不是一個沒有智慧的工具。

技術方面針對使用者所提需求實作了秒級響應。知彼阿爾法大模型能夠根據使用者語義,調取企查查企信資料,然後再把“整理、歸納”後的結果呈現給使用者。這種情況下,使用者得到的不再是一堆零散資訊,而是一個完整的答案。為提升響應速度,知彼阿爾法大模型已全量接入企查查超算平台,秒級時間就能完成查詢、浏覽、總結、結構化輸出等繁冗步驟。

新增“多輪對話”功能,讓商查平台具備了邏輯思考能力。知彼阿爾法大模型“多輪對話”功能,是該模型優于以往企查查對話式AI的一大亮點。借助這一能力,知彼阿爾法大模型可以引導使用者通過多輪對話的方式,一步步進行更深入的分析。在多輪對話中,使用者可以在已經得到的結果基礎上,提出新的指令,進而問出更深入的問題。這種方式,讓知彼阿爾法大模型不僅成為使用者的助手,還可以是“引路人”,循序漸進的引導使用者自己去尋求答案。

繼續閱讀