科大讯飞首次发布，“超级知识助手”来袭！

2024-04-26 20:08:00

4月26日，讯飞星火大模型V3.5春季上新。科大讯飞发布业界首个长文本、长图文、长语音大模型。

长文本、长图文、长语音一直是人机交互中的三大难题，它们各自的处理都需要复杂的算法和技术支持。长文本需要高效的分词、命名实体识别、情感分析等自然语言处理技术；长图文则需要图像识别、OCR、布局分析等计算机视觉技术；长语音则需要语音识别、语音合成、语音唤醒等语音交互技术。

而科大讯飞此次发布的长文本、长图文、长语音大模型，正是在解决这三大难题的基础上取得的重大突破。此次发布的模型能够优秀的处理不同来源的文本与信息，也能够对图文信息和录音资料进行快速学习，从而在各种行业场景中发挥作用。

本次讯飞星火长文本功能全新升级后，拥有文档归纳总结及信息提取和文本生成等能力，能够迅速提取信息资源。无论是复杂的句子结构还是丰富的词汇表达，长文本处理技术都能游刃有余地应对。同时，科大讯飞拥有强大的计算机视觉团队和先进的图像识别技术。其自主研发的图像识别算法，在物体检测、图像分类、场景解析等多个计算机视觉任务上均取得了世界领先的成绩，为长图文的处理提供了强大的技术支持。此外，面对广泛的音视频信息高效获取需求，科大讯飞也推出长语音功能，将国际领先的语音识别和翻译技术结合起来，可以实现会议录音、学习视频等的一键研读，实现音视频场景的高效知识获取。

科大讯飞为什么要推动这个模型的产生呢？要知道，用户工作时难免会拿到长文本资料，例如书籍、报刊、板书，甚至是各种录音和视频等。在此之前，用户很难将资料进行有效信息的提取。而科大讯飞此次所推出的大模型，就是关注到了用户在工作时的资料提取这一刚需问题，切身实地的解决了用户多源方式获取信息的需求。

科大讯飞长文本、长图文、长语音一体化智能交互解决方案的发布，不仅是科大讯飞在人工智能领域取得的重大突破，更是对未来人机交互方式的一次深刻探索，进一步推动大模型在各个场景的落地。该模型在未来将为多个领域提供强大的技术支持。

我们有理由相信，科大讯飞此次推出的模型只是一个开始，未来的人机交互将变得更加便捷、高效和自然。无论是企业还是个人，都可以通过人工智能，享受科技带来的便利与乐趣。

科大讯飞首次发布，“超级知识助手”来袭！

继续阅读

科大讯飞获“国家科学技术进步奖”一等奖

企业创新创投联盟走进科大讯飞，共话AI未来

科大讯飞分拆讯飞医疗赴港IPO，中国医疗人工智能行业排名第一

科大讯飞办公本X3对于经常会议记录的人来说，是不是一个好选择？

科大讯飞学习机和作业帮学习机哪个好？家长体验道出实情一文读懂

“寻根之旅”启程！“徽二代”走进科大讯飞

让世界听见“中国声音”，科大讯飞“声”动巴黎

科大讯飞x新华文轩：AI教育公益成果展，点亮知识之光

科大讯飞、酷狗等样品存听力安全隐患

科大讯飞原轮值总裁拟定增入主中创环保

入主壳股中创环保，科大讯飞联合创始人胡郁欲开AI“新局”？

中创环保拟定增5亿控制权将变更科大讯飞联合创始人胡郁成实控人

科大讯飞助阵联合国教科文组织特别演出——《我的梦》沟通无障碍

科大讯飞前轮值总裁将入主中创环保股民期待新篇章

科大讯飞创始人入主中创环保，醉翁之意不在酒？

科大讯飞股东户数增加2.15%，户均持股27.01万元