天天看點

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

作者:遠瞻智庫

(報告出品方/分析師:國盛證券 劉高暢 楊然)

一、AI 能力積澱已久,2023年或将重點發力

AI 積澱已久,自2017年起即被提升至戰略地位。

1)2016年,AlphaGo 掀起 AI 浪潮,金山辦公緊随其後加速布局;2017年,在公司内部 AI 被上升到戰略地位,AI 中台由此成立;2018年,金山辦公确立“多屏、雲、AI 和内容”四大戰略;2020年,智能辦公已見雛形,現已開發近 100 項 AI 辦公能力,涵蓋全文翻譯、文檔校對、智能寫作、PPT 美化、資料分析等,落地超過 18 項 AI 應用,斬獲 5 項國際 AI 技術大獎。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

2)我們認為,憑借研發實力、使用者積澱和辦公 Know-How,AI 已成金山辦公業績增長的重要加速器。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

副總裁姚冬牽頭組建,AI 團隊已逾百人。

1)根據 Info 報道,2017 年 5 月,暫離金山十餘年的老将姚冬重回老東家,擔任金山辦公副總裁。姚冬自 1998 年加入金山,此前曾負責過金山詞霸、金山遊俠等産品。

此番重回金山,姚冬轉型做 AI 方向的算法和工程産品,負責算法改進、推動工程落地、人才梯隊建設工作,牽頭組建了金山辦公的 AI 算法、工程和産品團隊。

2)截至 2022 年 11 月,金山辦公的 AI 團隊約有百人規模,劃分為基礎設施、平台、産品和應用、基礎算法等小組。

成立 5 年來,AI 團隊在每一階段側重不同的目标,分“三步走”戰略。前兩年,團隊更強調積累 AI 研發能力,包括算法能力,工程能力,資料采集,資料分析能力等。

後兩年更注重将技術産品化,關注 AI 産品能力。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

研發力度高,約 3 億募投資金用于辦公 AI 項目、計劃 4 年完成。

1)2019 年 11 月,公 司釋出招股說明書,募投項目中辦公領域人工智能基礎研發中心建設占據 16%,總投資 額約 3.19 億元。

2)辦公領域人工智能基礎研發中心建設方向的建設目标是利用辦公領域的人工智能基礎技術,提升 WPS Office 軟體對自然語言和圖像文字資訊等内容的了解及處理能力,實作提升使用者處理檔案的速度與效率。

主要發力:基于海量語料的人機協同輔助寫作系統研發項目、AI 自然語言處理平台項目、AI 計算機視覺識别平台項目。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元
AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

海量使用者、多樣場景,為 AI 提供豐厚的生長土壤。

1)截至 2022 年 9 月,公司主要産品月活裝置數達到 5.78 億,延續穩定增長。這一方面為公司積累了豐富的使用場景,另一方面也為 AI 技術的疊代更新提供了資料經驗基礎。

2)同時,依托在辦公領域 30 多年的研發經驗,公司從 PC 走向移動并走向雲,亦在住宿及餐飲業、制造業、建築行業、教育行業、零售行業等積累了對應的行業 Knowhow,具備強落地能力。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

多項能力已處于國内第一梯隊,緻力于重塑智能辦公。

1)截至 2021 年 7 月,公司自主研發的OCR和機器翻譯技術達到了國内第一梯隊的水準,智能校對月校對字數超70億;智能生成的内容占據整體内容資源比例為 33.6%,智能美化功能月度活躍使用者數量超百萬;AI 中台還打造了基于分布式訓練的 AI 訓練平台,包含了訓練資料處理、訓練排程、服務監控告警、鍊路追蹤等一站式平台。

2)根據副總裁姚冬表示,公司 AI 三大發展戰略:第一,圍繞文字智能處理,提升辦公效率;第二,基于認知智能的知識服務;第三,助力企業數字化轉型。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

2023 年将重點在 AI 領域發力,聚焦賦能企業數字化轉型。

1)3 月 14 日,根據新華網報道,科技創新是企業的命脈,更關乎國家戰略發展。金山辦公 CEO 章慶元在接受記者采訪時表示,“金山辦公是科技自立自強的受益者與踐行者,自成立至今 35 年來,堅持自主創新,解決‘卡脖子’問題,打造出我們自己的民族辦公軟體品牌”。

2)同時,“大力發展數字經濟”的政策利好将為金山辦公的發展帶來重要機遇。章慶元介紹,金山辦公今年的核心戰略目标是持續賦能企業數字化轉型,将重點在 AI 領域發力,尤其是在 AIGC(人工智能生成内容)方面實作更多技術應用突破,幫助客戶更好地實作數字化轉 型。

二、文字、圖像、語音三大技術協同發展,重塑智能辦公

2.1 文字:自然語言處理加速落地,文檔智能表現出衆

智能文檔處理空間廣闊,NLP 加速落地辦公領域。

自然語言處理技術疊代更新,在商業領域具備豐富的落地場景,并通過與知識圖譜、計算機視覺的技術融合,在文檔處理等辦公場景發揮重要作用。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

文檔智能通過對資料的深度挖掘,在人工資訊稽核、翻譯、智能寫作上表現出衆。根據 KBV Research 預測,全球智能文檔處理市場規模預計在 2027 年将達到 41 億美元,企業内部文檔資料難題得到有效環節,智能化辦公發展加速。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

WPS 布局前瞻,NLP 等現有成果已包括機器翻譯、文檔校對、輔助寫作:

1、機器翻譯:多語種翻譯能力增強,結合 CV 技術做好格式處理。

AI 技術應用後翻譯效果顯著提升,結合 CV 的版式分析優勢,機器翻譯保證格式、對齊、風格保持一緻。借助 WPS、稻殼網等産品生态,公司之前的金山智能翻譯可以實作文本、文檔及多個領域的翻譯,并可以進行譯後編輯。

同時,金山辦公釋出的蒙文版 WPS Office 2021,搭載了 AI 産品附加元件技術,其中機器翻譯轉化率超 90%。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

2、文檔校對:結合豐富的語料庫,黑馬校對 V30 保證高效。

1)在日常辦公中,錯别字問題屢現,文檔校對功能可以在極短時間内找到大部分錯别字,并實作分詞、文檔分類、識别、提取校對、列示錯誤給予修改意見等功能。

2)據 36 氪,2021 年金山辦公全資收購黑馬飛騰及其黑馬校對相關産品,2022 年 9 月金山辦公旗下黑馬校對 V30 版本正式上線,V30 版本分析上萬億漢字的語料,擁有約 8000 萬條漢語知識的資料庫和約 800 萬條錯誤規則的資料庫,應用于政府及企事業的公文校對和新聞出版行業的品質把關,并嵌入企業業務系統。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

3、輔助寫作:公文輔助已有探索,持續 2 年半投入智能寫作研發。

1)2018 年 6 月,金山辦公成為中國智能寫作産業聯盟理事長機關,該項目入選“2018 年人工智能與實體經濟深度融合創新項目”,現已推出公文智能(輔助)寫作、WPS 智能寫作功能。

2)公文智能(輔助)寫作幫助使用者按照 GB/T 9704-2012 規範性要求進行排版,内置 19 個公文模闆和 15 種法定公文文種,促進協作效率并避免不同軟硬體環境下的錯版和跑版情 況。

3)輔助寫作産品積累多個提綱庫和語料庫,資料均源于權威媒體和政府公開網絡,支援文本自動生成、輔助成稿、句子智能補寫和文本智能校對等多種功能,除此之外,機器自主學習可以結合使用者的行為資料和回報,判斷寫作偏好。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元
AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

2.2 圖像:OCR 積累已久,複雜場景、美化功能逐漸疊加

CV 多場景應用廣泛,OCR 作為底層通用能力商業價值已現。計算機視覺是通過深度學習算法,使得計算機了解數字圖像及視訊,并從多模态資料中提取目标資訊的能力。

OCR 技術作為 CV 的底層通用技術,是最具落地應用價值的 AI 技術之一,在智慧辦公、智慧教育、智慧金融、智慧交通、智慧城市、智慧旅遊等多個垂直行業中産生巨大商業價值。

目前金山辦公已探索文字識别技術在多個複雜場景下的應用,并發展計算機視覺技術,實作文檔矯正、智能摳圖、字型識别、表格還原、版式還原、PDF 編輯等多元功能。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

計算機視覺積澱深厚,現有成果包括 OCR、版式還原及圖像識别。

1、OCR:抽取-篩選-整理-彙集,支撐多環境部署,實作文檔結構化了解。随着 OCR 技術在移動端的運用頻率增強,金山辦公 OCR 技術疊代更新,除了了解中英文、簡繁體等多元文字資訊,還可以了解文字背後的語義和結構化資訊。

1)在 CSIG 圖像圖形技術挑戰賽中,金山在“中英文購物發票資訊了解”中,通過算法對 OCR 文字框和文字抽取、篩選,并了解中英文資訊實作整理和彙集,取得單項賽道冠軍及總決賽雙冠軍。

2)在部署環境上,金山辦公 OCR 支援服務端的高精度模型部署和支援手機、PC 端的小模型部署,且 2019 年,OCR 模型在移動端推理模型體積不足 10M,準确度僅比服務端下落 2%。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

2、版式還原系統:矯正-識别-分析-重建,還原多種複雜場景。

版式還原是指将複雜的圖檔型文檔解析為可編輯的文檔,幫助使用者在複雜場景下對不可編輯文檔進行再編輯;且金山将文檔掃描、文檔轉換、提取編輯內建為系統,滿足複雜需求下的複用性。該項技術目前在業内領先,公司內建 30 個深度學習模型、100+算法子產品、50+萬行代碼,實作彎曲矯正、污染光線、帶印章&簽名、沒有表格線等複雜場景版式還原。

3、圖像增強及智能排版:公司已可以借助算法實作文字風格的精準還原(對文字顔色、字型、加粗、斜體、下劃線等格式進行高度識别),及檔案的格式美化和智能排版。

目前金山辦公已将 CV 技術應用于智能摳圖、證件照制作、文檔品質提升、濾鏡、水印塗抹等衆多産品功能。

與此同時,金山辦公投資創客貼線上設計平台(持股 12.79%),該平台可以借助 AI 智能實作智能摳圖和圖文生成視訊的功能,顯著提高設計人員和文職人員的工作效率。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

2.3 語音:語音轉化豐富辦公場景,打造多層次辦公體驗

語音轉化功能打破語言邊界,實作高效便捷辦公。

金山辦公在辦公場景下的文字語音轉換功能也有豐富落地場景,其中,語音互動技術可實作 36 種語言轉換,實作文字到語音的快速轉化和閱讀;另一方面,公司還實作語言速記,在移動端和 PC 端均可适用;除此之外,審閱功能也新增語音批注,用語音實作資料查找和内容輸入,顯著提升辦公稽核便捷度。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

2.4 AI 中台:推出 KSAI-Lite 開源架構,通用、高性能、輕量和專業

AI 中台能力輸出,推出 KASI-Lite 深度學習推理架構。

公司 2017 年搭建内部平台,通過長期持續的技術投入,2021 年實作對外技術輸出。2021 年 7 月 22 日,金山辦公釋出 KSAI-lite 開源架構,該架構免費開源,不僅自适應國内外主流軟硬體平台及國産信創環境,并對性能、功耗、記憶體做了優化,為 OCR、機器翻譯、智能校對等場景提供技術支援。

KSAI-Lite 架構內建多種 AI 功能,可适宜多裝置離線計算場景。開源架構借助 TensorFlow 和 TensorFlow Lite 在架構層的算法優化能力,提供 AI 在單機、手機、PC 等裝置的離線計算,适應隐私資料在用戶端處理、算法執行快且實時等場景,目前金山辦公的技術積累已覆寫所有作業系統、裝置與指令集。

物體邊緣檢測:金山 WPS 設計的 CNN 文檔檢測網絡,可以讓安卓版使用者快速檢測結果,自動判斷邊緣并調整濾鏡;

自動識别圖檔類型:金山 WPS 利用 TensorFlowLite 實作了能夠自動識别圖檔類型 的 OCR 模型,提供對應的濾鏡和 OCR 輸出格式;

掃描件 OCR:采用 TensorFlow 部署模型,可以對文檔實作旋轉矯正、文本行檢測等操作,節省大量文檔編輯時間;

自然場景 OCR:利用 TensorFlowLite 将自然場景 OCR 運作在手機上,使它能在短時間内從複雜場景中準确定位文字并獲得理想的識别結果;

圖檔轉文檔的布局分析:金山 WPS 結合 TensorFlow 與 scikit-learn 架構一起進行圖文布局分析算法,大幅度降低了算法的研發成本。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

同步釋出 KSAI OCR 開源模型,可實作輕量化部署。

2021 年金山辦公技術開放日上,金山辦公當天還同步釋出了 KSAI OCR 開源模型。

OCR 模型以及庫檔案大小不超過 9MB,可輕量化部署,該模型在文本檢測、文本分類和文本識别上都表現出了較好的性能,OCR 的本質是将照片轉換為機器編碼的文本。

目前,OCR 技術已經在市場上逐漸普及,成為文檔資訊錄入方式的重要補充。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

KSAI-Lite 架構已上線主流開源社群,預計為公司主流産品及業界提供堅實支援。根據金山辦公官方微信公衆号,金山辦公副總裁、AI 中台負責人姚冬表示,截至 2021 年,KSAI-lite 架構已經上架主流開源社群 GitHub。

未來 KSAI-lite 還會在更豐富的平台适配能力、更個性的開發方式、更穩定的業務支援能力上持續發力,為金山辦公下主流産品和業界提供堅實的 AI 支援。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

三、邁入認知智能新紀元,AIGC 吸引海外巨頭持續入場

從感覺走向認知,“算力+算法+資料”,知識成為 AI 發展第四極。

1)感覺體系可以識别數字資訊和實體世界,認知體系在此基礎上更進一步,實作對感覺結果的歸納、推理、演繹、決策、回報、溯因。從辦公場景來看,隻有“認知智能”才能實作對發票格式、語義及零碎資訊的挖掘,智能了解發票類型、報帳風險、是否合規等問題。

2)人工智能的未來從簡單的資訊讀取走向資訊了解,除了算法、算力和資料的助力,需要把先驗知識融入算法模型,除了通識教育的預訓練,還需要業内專家進行精調整,達到更為專業的訓練成果。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

微軟計劃整合 OpenAI 工具進入旗下全線産品。

2023/01/23,微軟公司通過官方部落格宣布擴大與 OpenAI 的合作夥伴關系,将向 OpenAI 進行一項為期多年、價值數十億美元的投資,以助力其在 AI 領域的技術突破。

2023/01/17,微軟 CEO 納德拉在達沃斯世界經濟論壇上表示,下一階段微軟将專注于将各類工具加速推向市場,實作 OpenAI 的工具商業化,公司計劃将包括 ChatGPT、DALL-E 等人工智能工具整合進微軟旗下的全線産品中,包括 Bing 搜尋引擎、Office 全家桶、Azure 雲服務等。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

AI 辦公或是生成式人工智能首批落地的領域之一。

據機器之心消息:3 月 7 日,微軟宣布将 ChatGPT 的技術擴充到其 PowerPlatform 平台上,這将允許使用者在很少甚至不需要編寫代碼的情況下,就能開發自己的應用程式。

另外微軟将于 3 月 16 日舉辦一場名為 “The Future of Work with AI”的線上活動,首席執行官納德拉或将展示類似 ChatGPT 的人工智能如何在 Teams、Word 和 Outlook 等 Office 生産力套件中發揮作用。

AI 能力積澱已久,金山辦公:國産軟體扛旗者邁入智能辦公新紀元

我們認為,憑借紮實的研發實力、海量的使用者及場景積澱、深厚的辦公 Know-How,AI 有望成金山辦公業績增長的重要加速器。

風險提示

雲服務推進不及預期。目前雲計算在大陸處于快速滲透期,若下遊客戶對雲服務的接受程度暫緩,可能會影響公司業務推進。

國有機關 IT 支出不及預期。信創與政策、預算等因素相關性較大,若黨政、行業類 IT 支出不及預期,短期内或對公司業務産生波動影響。

人員增速超預期。軟體類企業的重要資産為企業員工,其工資支出、獎金福利、補貼等占據企業成本的重要部分,若人員增速高速提升,短期内或對公司利潤釋放造成影響。

宏觀經濟風險。宏觀經濟的影響因素較多,或對公司業務推進産生影響。

——————————————————

報告屬于原作者,我們不做任何投資建議!如有侵權,請私信删除,謝謝!

報告選自【遠瞻智庫】文庫-遠瞻智庫

繼續閱讀