天天看点

科大讯飞首次发布,“超级知识助手”来袭!

作者:欧界科技

4月26日,讯飞星火大模型V3.5春季上新。科大讯飞发布业界首个长文本、长图文、长语音大模型。

长文本、长图文、长语音一直是人机交互中的三大难题,它们各自的处理都需要复杂的算法和技术支持。长文本需要高效的分词、命名实体识别、情感分析等自然语言处理技术;长图文则需要图像识别、OCR、布局分析等计算机视觉技术;长语音则需要语音识别、语音合成、语音唤醒等语音交互技术。

科大讯飞首次发布,“超级知识助手”来袭!

而科大讯飞此次发布的长文本、长图文、长语音大模型,正是在解决这三大难题的基础上取得的重大突破。此次发布的模型能够优秀的处理不同来源的文本与信息,也能够对图文信息和录音资料进行快速学习,从而在各种行业场景中发挥作用。

本次讯飞星火长文本功能全新升级后,拥有文档归纳总结及信息提取和文本生成等能力,能够迅速提取信息资源。无论是复杂的句子结构还是丰富的词汇表达,长文本处理技术都能游刃有余地应对。同时,科大讯飞拥有强大的计算机视觉团队和先进的图像识别技术。其自主研发的图像识别算法,在物体检测、图像分类、场景解析等多个计算机视觉任务上均取得了世界领先的成绩,为长图文的处理提供了强大的技术支持。此外,面对广泛的音视频信息高效获取需求,科大讯飞也推出长语音功能,将国际领先的语音识别和翻译技术结合起来,可以实现会议录音、学习视频等的一键研读,实现音视频场景的高效知识获取。

科大讯飞首次发布,“超级知识助手”来袭!

科大讯飞为什么要推动这个模型的产生呢?要知道,用户工作时难免会拿到长文本资料,例如书籍、报刊、板书,甚至是各种录音和视频等。在此之前,用户很难将资料进行有效信息的提取。而科大讯飞此次所推出的大模型,就是关注到了用户在工作时的资料提取这一刚需问题,切身实地的解决了用户多源方式获取信息的需求。

科大讯飞首次发布,“超级知识助手”来袭!

科大讯飞长文本、长图文、长语音一体化智能交互解决方案的发布,不仅是科大讯飞在人工智能领域取得的重大突破,更是对未来人机交互方式的一次深刻探索,进一步推动大模型在各个场景的落地。该模型在未来将为多个领域提供强大的技术支持。

我们有理由相信,科大讯飞此次推出的模型只是一个开始,未来的人机交互将变得更加便捷、高效和自然。无论是企业还是个人,都可以通过人工智能,享受科技带来的便利与乐趣。

继续阅读