訓練AI大模型需要大量的AI語料,但由于資料挖掘不足、無法自由在市場上流通等現狀,中文優質資料仍然稀缺,AI語料相關企業受到廣泛關注。
本文為企業價值系列之【盈利能力】篇,共選取33家AI語料企業作為研究樣本,并以淨資産收益率、毛利率、淨利率等為評價名額。
資料基于曆史,不代表未來趨勢;僅供靜态分析,不構成投資建議。
AI語料盈利能力前十企業:
第10 拓爾思
盈利能力:淨資産收益率10.30%,毛利率61.30%,淨利率20.80%
主營産品:大資料軟體産品及服務為最主要收入來源,收入占比40.11%,毛利率69.69%
公司亮點:拓爾思聯合智源研究院等機關共建的“中文網際網路語料庫”已正式釋出。
第9 博彥科技
盈利能力:淨資産收益率10.75%,毛利率25.36%,淨利率6.70%
主營産品:研發工程為最主要收入來源,收入占比57.09%,毛利率21.47%
公司亮點:博彥科技為部分客戶提供AI大模型訓練相關的語料、資料标注、資料訓練等服務。
第8 新緻軟體
盈利能力:淨資産收益率7.33%,毛利率28.07%,淨利率5.26%
主營産品:IT解決方案為最主要收入來源,收入占比84.83%,毛利率22.01%
公司亮點:新緻軟體産品研發主要通過新緻新知語料庫和機器人平台作為支援底層。
第7 芒果超媒
盈利能力:淨資産收益率15.64%,毛利率34.48%,淨利率13.60%
主營産品:芒果TV網際網路視訊業務為最主要收入來源,收入占比76.85%,毛利率42.67%
公司亮點:芒果超媒豐富的版權内容資料資産為“芒果大模型”的研發提供了高品質的訓練語料。
第6 中國科傳
盈利能力:淨資産收益率10.77%,毛利率29.00%,淨利率18.31%
主營産品:出版物進出口業務為最主要收入來源,收入占比52.23%,毛利率6.54%
公司亮點:中國科傳先後推出了“科學文庫”“科學智庫”“中國生物志庫”等多個數字化産品和知識服務平台。
第5 德生科技
盈利能力:淨資産收益率10.56%,毛利率44.95%,淨利率12.98%
主營産品:一卡通及AIOT應用為最主要收入來源,收入占比80.03%,毛利率48.57%
公司亮點:德生科技智能知識營運服務已在全國60多個地市部署,為公司訓練大模型積累了大量的語料。
第4 中文線上
盈利能力:淨資産收益率-5.32%,毛利率61.14%,淨利率-4.10%
主營産品:文化産品為最主要收入來源,收入占比97.73%,毛利率49.58%
公司亮點:中文線上在開源 AI 模型技術基礎上利用公司在文學領域的語料資料,部署在自有伺服器上進行AI大模型研發和訓練。
第3 健麾資訊
盈利能力:淨資産收益率18.25%,毛利率53.88%,淨利率33.47%
主營産品:項目收入為最主要收入來源,收入占比78.76%,毛利率61.46%
公司亮點:健麾資訊擁有成熟的資料脫敏技術,能夠在保護使用者隐私的同時,確定脫敏後的資料可用于支援國内大型模型的訓練工作。
第2 上海鋼聯
盈利能力:淨資産收益率13.97%,毛利率1.85%,淨利率0.54%
主營産品:供應鍊服務業務為最主要收入來源,收入占比96.35%,毛利率0.60%
公司亮點:上海鋼聯大模型的語料是基于公司擁有的資料,經過大量資料治理工作産生的高價值語料資料。
第1 同花順
盈利能力:淨資産收益率32.50%,毛利率90.90%,淨利率54.20%
主營産品:增值電信服務為最主要收入來源,收入占比42.89%,毛利率86.14%
公司亮點:同花順自研的問财 HithinkGPT 大模型是公司從訓練語料、訓練架構到模型結構的設計,均從零開始、創新建構,預訓練金融語料達到萬億級 tokens。
AI語料盈利能力前十企業,近三年淨資産收益率、毛利率、淨利率: