讯飞星火大模型再升级 首发长文本、长图文、长语音功能

2024年04月29日21:15来源:中华工商网
  【记者牛畅北京报道】近日,讯飞星火大模型V3.5(以下简称“讯飞星火”)进一步升级。面向用户高效准确获取知识的痛点,科大讯飞首次推出长文本、长图文、长语音大模型,不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行快速学习,还能在各种行业场景给出专业、准确回答。
  科大讯飞分析发现,在知识获取和学习的过程中,广大用户能拿到的资料往往不仅是现成的长文本,还有随手可见的报刊、书籍内容,各种研讨会的展示内容,老师黑板上的板书、同学的笔记,以及各种会议录音、访谈等。把这些文本、图片、语音等都上传到讯飞星火中,让用户快速地获取知识,需进一步破题。为此,科大讯飞推出首个支持长文本、长图文、长语音的大模型,来解决多元化场景中多源信息的获取需求。
  本次讯飞星火长文本功能升级后,具备长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力,总体已经达到GPT-4 Turbo 4月最新长文本版本的97%水平,而在银行、保险、汽车、电力等多个垂直领域的知识问答任务上,讯飞星火长文本总体水平已经超过GPT-4 Turbo。
  面对上百万甚至上千万文字,长文本大模型消耗的运算资源非常大。长文本功能的落地,需要解决信息高效处理的问题。
  为了保证大模型应用效率和准确率,刘庆峰表示,基于讯飞星火V3.5对长文本的理解、学习、回答能力,科大讯飞进行了重要的模型“剪枝”和“蒸馏”,从而推出130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传解析处理、知识问答的首响时间以及文字生成方面都获得较好的效率提升。
  此外,面向复杂的图文场景,科大讯飞基于多年技术积累,首次推出星火图文识别大模型;面对广泛的音视频信息高效获取需求,科大讯飞也推出长语音功能,将国际领先的语音识别和翻译技术结合起来,实现会议录音、学习视频等的一键研读。
  值得一提的是,自今年1月30日发布以来,讯飞星火V3.5作为首个全国产算力训练的大模型,受到了各行业伙伴和开发者的欢迎。据刘庆峰介绍,大模型云边端的整体解决方案正在赋能汽车、家电、运营商等越来越多的行业。在过去不到3个月的时间里,讯飞新增了55万实名认证的开发者,其中一半以上来自企业。
  对企业来说,如何高效地获取和学习知识同样是痛点,科大讯飞给出的答案是智能体,并面向企业场景推出全新的智能体平台。
  刘庆峰谈到,在讯飞星火智能体平台上,针对用户的输入,首先,会自动实现用户输入的精准理解和任务规划。其次,解析完相关的任务和对应的工具之后,讯飞星火也构建形成了包括天气、航班、企查查等成体系的外部信息来源的对接。同时,星火智能体平台还通过互认证的机制,实现了往往是独立的、隔离的OA系统、CRM系统以及ERP系统的打通,完成相应操作。最后,通过私域知识融入机制,智能体平台很容易实现企业所属行业以及企业私域知识的融入,能完成更精准的专业理解和知识问答。
  此外,星火智能体平台还可以通过拖拽方式实现新智能体的创建和多智能体的协作,触达大模型应用企业落地的“最后一公里”。
  据刘庆峰透露,科大讯飞将在6月27日发布讯飞星火大模型V4.0,进一步解放生产力、释放想象力。
  (编辑 牛畅)