今年以来,大模型产业步入应用深水区,呈现出群雄逐鹿的势头。4月26日,科大讯飞旗下讯飞星火大模型V3.5宣布迎来春季上新。面向用户高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型,升级后的讯飞星火大模型V3.5版本不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行快速学习,还能够在各种行业场景给出专业、准确回答,让大模型由“好用”迈入“常用”新阶段。

作为业界首个同时支持长文本、长图文和长语音的大模型,本次讯飞星火V3.5长文本功能全新升级后,具备长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力,总体已经达到GPT-4 Turbo 4月最新长文本版本的97%水平,而在银行、保险、汽车、电力等多个垂直领域的知识问答任务上,讯飞星火长文本总体水平已经超过GPT-4 Turbo。

科大讯飞发布业界首个长文本、长图文、长语音的大模型  讯飞星火科研助手再升级 第1张

随着文本越来越长,效率是关键,当文本信息达到几十万字甚至上千万字的时候,考验的不止是大模型理解与概括能力的最优解,还需要兼顾获取的效率与质量。为了解决大模型应用效率和准确率问题,刘庆峰谈道,基于讯飞星火V3.5对长文本的理解、学习、回答能力,科大讯飞进行了重要的模型剪枝和蒸馏,从而推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。测试显示,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本上,星火大模型的性能都做到业界最优。

当登陆讯飞星火PC版你会发现,输入框上方新增支持长文本、长图文、长语音的上传按钮,仅长文本一项就支持pdf、doc、txt等多种主流格式。在演示视频中,科大讯飞副总裁、研究院院长刘聪用《星火相传》这本书进行了演示,该书文件格式是PDF,容量为14MB、共计400页、合计27万字,讯飞星火不仅快速领会了全书要义、知识点与研究成果,更机智地回答了刘聪对书中有关大模型生态布局建议的提问,涵盖了平台建设、产业应用、产学研合作、数据质量、社会责任五大核心环节。

科大讯飞发布业界首个长文本、长图文、长语音的大模型  讯飞星火科研助手再升级 第2张

除了发布业界首个长文本、长图文、长语音的大模型,此次讯飞星火V3.5的升级,还带来了更有温度的“多情感超拟人合成”语音功能,不但抑扬顿挫更自然,而且还会聪明地带上语气助词,让对话更有情感共鸣。根据数据显示,讯飞星火超拟人合成情绪表达的可感知度达到85%以上。除了超拟人对话,科大讯飞还推出“一句话声音复刻”功能,一句话就可以定制你的AI助手声音。妈妈可以在出差时复刻自己的声音给孩子讲故事,孩子可以复刻自己声音给爷爷奶奶读书读报,让个性化语音合成进阶至一句话声音复刻,原来声音还能这么“玩”!

如果说超拟人合成语音强化的是大模型“能说会道”的能力,那么星火图文识别大模型的首发,无异于给大模型装上了“眼睛”。此次星火图文大模型覆盖了31个场景、18种版面要素,包括对学术论文、报纸、海报甚至PPT等复杂版面的高精度解析,加上融合篇章语义的文字识别,还有覆盖更多领域的专业符号识别,使得大模型在科研、金融、教育等领域拥有更加广泛的应用前景。

科大讯飞发布业界首个长文本、长图文、长语音的大模型  讯飞星火科研助手再升级 第3张

除了技术层面的进阶,讯飞星火V3.5还面向场景端发布或升级了一系列新应用,其中,讯飞星火大模型赋能的科研助手再提效。在去年科大讯飞全球1024开发者节上,星火科研助手首发,当时提供成果调研、论文研读和学术写作三大核心功能,受到了学术界的一致好评。而这次升级后的星火科研助手增加了对多媒体资料的获取和理解能力,可以通过获取各种照片与学术录音资料对科研人员进行强力辅助。据了解,星火科研助手目前已在中国科学院、三亚崖州湾科技城、北京邮电大学、哈尔滨工业大学等机构高校铺开应用。多模态能力升级下,讯飞星火科研助手也进一步提升了论文问答、综述生成、实验解读等的效果,使得解析的学术资料更加丰富,进一步赋能高校和科研院所的科研工作。

从1月30日科大讯飞正式发布讯飞星火V3.5版本,到4月26日讯飞星火V3.5春季上新,短短不到三个月时间,星火生态实名开发者数量新增55万之多,超50%应用服务于企业刚需,这意味着讯飞星火实现了C端与B端用户的全覆盖。而越来越多开发者加入讯飞生态,又使得星火大模型在更多刚需场景释放价值,继而产生了正向循环的飞轮效应,加速了大模型的商业化闭环。

此外,科大讯飞还宣布将于今年 6 月27日正式推出讯飞星火 V4.0 版本,期待以讯飞星火为代表的国产大模型持续进化,为刚需场景释放更多新质生产力。