天天看点

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

作者:远瞻文库

(报告出品方/分析师:财通证券 程兵 佘炜超)

1 机床龙头,发力数据预训练再塑成长动能

汇洲智能是大陆传统机床龙头。公司机床业务起家,旗下控股子公司齐重系机床等高端装备制造业务的经营主体,历经73年发展,成为大陆传统机床龙头企业。

为迎接AI浪潮,发力AI大模型数据预训练业务,重塑新的成长动能。公司为迎接AI发展浪潮,通过收购积极布局AI大模型数据预训练业务。2019年收购长华文化,取得热热文化控制权,作为AI数据与训练业务的经营主体,同时将控股子公司中科汇洲数商作为AI数据预训练业务的技术研发主体。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

1.1 夯实重工基础,机床为发展压舱石

公司机床业务产品矩阵完善。公司始建于1950年,是国家一五时期重点建设项目之一,高端制造底蕴丰厚。历经73年积累,已成为大陆重要的数控机床生产基地。截至目前已形成38万平方米的机床生产基地,包含10大类,26系列,600多品种的机床产品矩阵。

公司多项技术弥补海内外空白。截至目前,公司400多项具备自主产权的产品填补国内空白;立式车床加工直径最小可达0.5米,最大可到填补国际空白的25米;卧式车床加工直径最小可达1米,最高到填补国际空白的6.3米。广泛用于船舶、汽车、风电等下游行业。

“齐一”品牌优势显著。“齐一”数控机床是中国知名机床品牌,部分高端机床产品已成功出口欧美、日韩等30多个国家和地区,截至2023H1重型车床市场占有率40%到50%,重型深孔钻镗床市场占有率100%。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

持续扩大研发支出,搭建“4+3+N”的创新体系巩固研发优势。历经73年发展,公司机床产品研发经验丰富。近年来,公司发力构建“4+3+N”的创新体系:搭建4个科技创新平台,培育3个科技创新团队,引进N家科研院所及企业,高平台化研发能力,巩固研发优势。截至2023H1,公司是大陆重型卧式车床、重型深孔钻镗床、重型立式车床的国家检验标准制定单位,主持和参与制修定标准累计77项,专利授权302项。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

公司技术团队经验丰富,持续扩大研发支出。截至2022年底,公司研发人员数量187人,同比2021年提升15%,其中40岁以上占比57%,多数研发人员拥有多年研发经验。公司持续扩大研发支出,2022年研发支出64.84百万元,同比增长56.05%,研发支出占比营收9.23%,同比提升4.27pct。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能
传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

2020年起,公司紧跟下游需求变动双向发力,实现机床产品的全面升级。

公司纵向紧跟需求变动,向下游热门行业拓展。为承接下游风电行业的需求释放,公司快速针对风电主轴、法兰、回转支承研发了数控专用卧车、定梁立车、硬车和滚齿机等一系列产品,2022年风电行业产品新增合同额占比高达60%以上。

公司横向紧跟行业技术趋势,向高端品升级。2022年公司发力研发适用于下游航空航天、船舶、能源行业的高精度机床,完成全新高端产品设计26台,技术准备147项,电气设计190项,工艺设计221项。

截至2022年底,公司仍存在8项高端产品在研项目。其中超声微锻造辅助激光增材制造项目,有望弥补国内技术空白;基于5G通讯的智能机床在研项目,有望助力公司产品的智能化转型升级;数控重型卧式镗床针对风电主轴内孔,国内领先,下游应用前景广泛。

1.2 发力AI数据预训练,重塑成长动能

公司受益于大模型赛道的长坡厚雪,依靠三大核心壁垒:丰富的技术和产品矩阵、高粘性的优质客户、经验丰富的核心技术团队,快速成为AI数据服务商新秀。

公司布局数据预训练业务,重塑新的发展动能。公司于2019年收购徐州长华100%股权,取得了对热热文化的控制权,构建AI数据预训练业务经营主体,同步设立控股子公司人民中科数商为AI数据预训练研发主体,提前研发布局,承接下游数据标注需求的释放。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

公司数据业务矩阵分为互联网内容审核和AI数据标注两大板块,数据标注产品和技术已进入行业前列水平。

公司已形成行业领先的数据标注技术矩阵和数据集产品矩阵,截至当前,已实现针对文本、图片、语音、视频等数据类型的标注,其中计算机视觉相关的视频追踪、打点、连续帧技术;2D图像语义分割;3D点云融合、连续帧等数据标注技术,适用于下游自动驾驶、人形机器人等热门终端场景;沉淀的可复卖的标品数据集涵盖文本、图片、音频、视频;并可针对自动驾驶、城市规划、医学影像诊断等场景制定解决方案。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

内容审核业务在人员规模、内容覆盖和准确率多维度领先同业。热热文化2016年成立,发展至今已在北京、成都、绥化、枣庄、金华设立五个规模型审核、标注基地,审核团队规模超5千人,累计培养审核人才超5万人,累计审核数据20亿条;在网络内容的安全审核业务事故率和遗漏率均较低。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

公司核心团队自带AI数据预训练产业经验,背景丰富奠定研发优势。数据预训练研发主体中科汇洲数商人民网+中科院北京紫东科技中心等多方牵头创办研发平台,自带AI数据技术背景和产业经验。

业务主体热热文化总经理李刚是前阿里云互联网事业部技术负责人,公司监事、技术团队负责人李兵是中科院自动化所博导,人民中科首席科学家,曾成功开发跨模态预训练智能搜索引擎“白泽”模型。

公司已形成多层次、高粘性的客户矩阵。公司内容审核业务起家,与人民网渊源深厚,起点高叠加深耕基础数据服务数年,公司依靠高质量服务已成功建立多层次高粘性的客户矩阵,遍布下游互联网、人工智能科技企业、航天、重工、金融、政务、高校等行业。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

2 场景驱动,AI预训练数据有望增长

2.1 预训练数据是AI产业链的基石

数据是AI产业链上游的基石。ChatGPT大模型引领本轮生成式AI浪潮,纵观当前的AI产业链,上游数据来源于终端场景的采集,是算法感知世界的起点;中游模型开发是数据应用的工具;下游场景端拉动模型算法迭代;监管是贯穿上下游全环节的刚需。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

根据AI分析公司Congnilytica研究显示,AI项目中数据处理过程占据80%的时间,其中数据标注占比25%,针对复杂场景数据的有效预处理,可缩短数据识别、整合、增强、清洗、标注全环节的时间周期,为模型开发节约成本。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

纵观AI数据链,AI数据预训练环节是承上启下的关键抓手。

预训练数据服务承接上游数据来源:非结构数据只有经过预训练处理才能激活其价值。AI预训练数据服务将场景端语音、图像、文本、视频、点云等非结构化数据进行采集、清洗、标注、质检,形成AI模型可直接利用的有效预训练数据集。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

预训练数据助力下游算法设计、训练、评测、迭代全生命周期降本增效。

(1)算法设计环节,利用小批量预训练数据对算法初步的设计进行验证,减少模型设计的方向性偏差。

(2)算法训练环节,有效简化模型参数规模,节约算法开发时间。

(3)算法测评环节,少量人工标注的预训练数据可作为模型输出结果的对照组,有效评定模型的准确性。

(4)算法迭代环节,针对bug对预训练数据进行精确标注处理,进而对模型精准修复,有效提升模型性能。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

2.2 多模态趋势显著,提升数据预训练的重要性

多模态预训练数据是解决AI应用长尾问题的关键,大模型与垂直领域的产业结合趋势带来的多模态技术迁移,将进一步提升预训练数据环节的重要性。

海内外模型多模态趋势显著,输入数据从海量语言信息、文本信息,发展为多类垂直领域的多模态数据。叠加模型底层是模型通过对指令的理解,建立起不同模态数据,如:文本、语音、视频、图像等数据的关键特征,并建立多维映射。因此,模型训练和优化过程需要海量的多模态数据。数据预训练通过对非结构化多模态数据进行跨模态特征的提取、对齐和融合,解决产业结合下多模态数据难以有效识别和语义信息深度利用的痛点。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

模型趋向特定方向上的优化迭代,竞争焦点从参数规模转移到与数据质量。

伴随大模型与垂直领域的产业结合更多模型或将采用类强化学习模式来进行特定领域或特定方向上的优化迭代,因此,在模型预训练环节、微调环节,高质量的标注过的指令数据是模型精确度、泛化能力的基础。

竞争焦点从参数规模的竞争到数据质量的竞争。如大模型诞生初期,主流观点是参数规模是模型效果增强的核心要素,模型参数越大,性能表现越好,当前这一观点正逐渐被打破。如Llama-13B参数规模为GPT-3的1/13,依靠模型训练数据规模,最终常识推理、闭卷问答、阅读理解等方面表现略优于GPT-3。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能
传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

2.3 场景落地,驱动数据预训练需求释放

模型演变趋向算法功能至上,数据成为场景落地重要的推动力量,全球范围内AI预训练数据需求快速增长。ChatGPT诞生初期,模型预训练数据为截止到2019年5月的历史存量数据,本来伴随模型在垂直领域的结合,海量终端全新数据的标注需求有望释放。根据Cognilytica预测,2022E全球AI训练数据市场规模为393亿元,2027E年有望达到1574亿元,2022E-2027E全球市场五年复合增速31.98%。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

智能驾驶是数据预训练未来五年弹性最大的应用场景,2022E-2027E五年复合增速为37%。根据德勤测算,2022E年中国基础数据服务行业市场规模为45亿元,预计2027E年最高有望达到160亿元,2022E-2027E五年复合增速为29%。从终端场景出发,当前自动驾驶、智慧工业、互联网内容等终端场景占比数据服务行业较大市场份额。

车型迭代进展、量产进度、渗透率三个因素将有望催化数据处理需求呈现指数级增长。

(1)车型迭代过程中,不同传感器配置需要基础数据服务商定制不同的数据解决方案。

(2)量产进度带来终端场景数据加工规模的指数级增加。

(3)渗透率的提高加深了场景数据的复杂性,针对复杂场景多模态数据的加工精度对数据标注提出更高的要求。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

数据推动应用端和模型迭代的共振,未来有望反向赋能场景落地。数据预训练是整个大模型训练的知识灌输阶段,数据标注服务商为大模型提供大量标签数据,保证模型真正学习产业核心数据知识,进一步加深产业适配。高质量预训练数据集是大模型自反馈强化学习机制的前提,加速大模型迭代齿轮运转,长期实现场景落地和模型迭代的共振。

3 布局自动驾驶,快速铸就行业壁垒

3.1 发力智能标注,助力降本增效

智能工具辅助标注,助力数据预训练业务降本增效。

公司通过智能预标注、人机交互辅助标注、智能质检等,实现降低人员成本,同时也能够快速地提升AI模型能力。当前人工智能标注众包平台、人工智能巡检审核平台均进入运营阶段。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

(1)人机交互辅助标注:公司上线Enable AI智能化标注平台,人机交互模式,提升复杂终端场景数据标注的效率和准确度。如人工点击,AI高精度识别整车的轮廓;针对3D点云数据,自动对连续帧数据的后续帧进行智能标注和预测。

(2)智能预标注:针对较简单场景的数据,首先利用人工标注的小样本数据训练辅助预标注模型,其次模型预标注剩余样本数据,最后人工质检。

(3)智能质检:通过AI智能质检模型的巡检,一方面发现人工标注失误,如说漏标或错标,提高数据标注质量。另一方面定位样本数据中较难样本,针对性提高质检人员的专业程度,进而提升质检效率。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

智能标注助力数据预训练和模型开发互相赋能,海内外龙头纷纷切入,降本增效效果显著。智能辅助标注一方面助力数据预训练服务商提升标注效率,降低标注成本;另一方面赋能模型开发商提升模型性能,提高模型研发效率,实现闭环。当前行业自动标注趋势显著,海内外龙头纷纷切入,降本增效效果显著。如海天瑞声上线一体化智能数据处理平台,并接入开源大模型;澳鹏自研智能辅助标注平台,通过数据预标注可提升效率91.5%。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能
传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

3.2 切入自动驾驶,享受更多行业增量

平台化统筹、智能化、技术先进性是自动驾驶场景数据预训练的的准入壁垒,公司始终紧跟AI大模型应用场景的转变,依靠技术、产品、研发优势,抢先布局自动驾驶赛道,将会更好掌握智能驾驶数据市场的主动权,切分更多行业增量空间。

(1)平台化统筹能力:公司针对自动驾驶场景,已成功积累项目统筹管理经验和数据预训练处理经验。当前完善的人员管理架构助力大型项目人员的高效分配;针对数据多样性和复杂性,设置合适的置信区间、算法引擎投票机制、置信区间等,提高数据预训练的质量和效率。

(2)智能化水平:将激光雷达和深度摄像头等终端传感器获取的点云数据进行标注,可助力自动驾驶舱外算法和服务机器人实现预判,如精准的环境感知、高效的路径规划、可靠的障碍物检测,最终助力算法的行为决策。截止当前,公司智能辅助标注工具已实现点云连续帧、点云融合标注,为自动驾驶场景构建更加全面的三维环境模型。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

(3)技术先进性

终端场景的变动,驱动数据预训练企业对终端软件层算法趋势和硬件层数据采集趋势形成自身洞察,前瞻性研发布局,不断迭代标注技术,持续保持技术先进性。截至目前,公司已具备自动驾驶方案解决能力,具备舱内语音、舱外图像、视频等多类型数据的标注能力。

如表5所示,Enable AI智能标注平台支持传感器3D点云数据的连续帧标注、不同数据的点云融合。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

智能驾驶场景有望领先释放预训练数据需求,需求释放进度随算法迭代和落地车型量产的时间呈现周期性收敛。

考虑数据处理位于算法开发产业链上游,数据需求前置于终端场景,智能驾驶场景有望领先释放预训练数据服务行业。根据德勤测算,2027E年智能驾驶带来的AI预训练数据服务需求有望达到83亿元,2022E-2027E五年复合增速为37%,占据市场份额52%。

2022年自动驾驶处于研发并推进L2+级别的自动驾驶落地,2025年有望实现L3级别自动驾驶的商业应用,2030年有望实现L4级别自动驾驶的逐步落地。

因此,目前将继续受益于L2+向L3技术迭代带来的数据需求放量,2025年之后基础数据需求将开始相对收敛。2027年开始L3+向L4升级迭代,算法迭代提升应用场景的复杂性,AI预训练数据处理需求指数级上升,2027年需求或将开始新一轮逐步释放。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

4 盈利预测与估值

4.1 盈利预测

主营业务收入假设:

(1)机床业务:2022年公司该部分业务收入为6.09亿元,增长28.61%。公司位于机床设备制造第一梯队,技术壁垒稳固。根据公司历史两年的销量数据,假设2023-2025年销量为500、512、515台,对应该部分业务营收分别为7.61、 9.29、11.33亿元,对应增长率分别为24.89% 、22.21% 、21.87%

(2)数据预训练业务:该部分业务主要为网络内容审核和大模型预训练数据标注,当前体量占比营收较小但弹性可观,有望成为未来业务增长的最大动能。

当前自动标注模型研发进展顺利,叠加下游客户拓展已初见成效,我们假设2023-2025年该部分业务增速回调至65.13%、99.15%、60.21%,对应2023-2025年营收为0.50、1.00、1.60亿元,对应增长率分别为65.13%、99.15%、60.21%。

(3)其他业务:2022年公司该部分业务收入和上年相比呈微增趋势,变化相对稳定。假设未来继续保持平稳增速,我们预测公司2023-2025年该部分业务营收分别为0.75、0.77、0.79亿元。

综上预计2023-2025年营收为8.86、11.06、13.72亿元,同比增长26.11%、24.83%、24.01%。

毛利率假设:

(1)机床制造业务:公司该部分业务工艺成熟,存在规模效应,且当前公司横向发力向中高端市场切换,毛利率有望持续改善,预计2023-2025年分别为22.99%、24.23%、25.12%。

(2)数据预训练业务:公司该部分业务有望受智能驾驶场景应用的催化,业务从互联网内容标注切换到高附加值的预训练数据标注,未来随着自研模型落地,有望实现半自动化标注,进一步提升毛利率。预估毛利率相对稳定,预计2023-2025年分别为21.12%、22.85%、25.16%。

(3)其他业务:假设毛利率水平平稳变动,预计2023-2025年为22.86%、21.73%、20.92%。

综上,考虑业务占比推算公司2023-2025综合毛利率为22.87%、23.93%、24.88%。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

4.2 估值

公司当前主营业务为机床业务,故选高端设备制造龙头秦川机床、海天精工和亚威股份。海天精工为最新预测数据,秦川机床和亚威股份为wind一致预测数据,2023-2025年可比公司的PE平均数值为36.40X 、27.32X、21.77X。

公司在传统核心机床制造业务技术壁垒稳固,优势明显。新切入基础数据服务赛道受益大模型的长坡厚雪,叠加公司前瞻性卡位智能数据标注和汽车自动驾驶,有望切分更多行业份额。

综上所述,我们预计公司2023-2025年实现营业收入8.86/11.06/13.72亿元,归母净利润1.82/2.66/3.54亿元,对应PE分别为41.69/28.53/21.45倍。

传统机床龙头,汇洲智能:发力智能标注和自动驾驶,重塑成长动能

5 风险提示

1、大模型产业结合不及预期

大模型产业结合的落地进度受到模型迭代水平,产业数据确权,产业数据采集标注难度增加等多方面的压力,模型产业结合任重道远。

2、智能数据标注市场竞争加剧

国内智能数据标注市场参与者为头部数据服务公司,大厂自研数据众包平台等,随着市场放量,多家先后自研数据标注模型,抢占先发红利,竞争逐渐加剧。

3、智能标注平台落地不及预期

公司自研的智能标注大模型仍在研发过程中,存在技术难关攻克难以匹及预期的风险。

——————————————————

报告属于原作者,仅供学习!如有侵权,请私信删除,谢谢!

报告来自【远瞻智库】

继续阅读