
文/赵东 图片由科大讯飞提供
10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布讯飞星火4.0 Turbo,首发10项基于讯飞星火底座能力的硬核产品与创新应用,包括超拟人数字人、汽车端侧星火大模型、星火多语言大模型等。同时,国产超大规模智算平台“飞星二号”也正式启动。

讯飞星火4.0 Turbo:国际14项主流测试集9项超越,提效50%
由艾伦人工智能研究所、OpenAI等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,讯飞星火4.0-Turbo在其中9项测试集中实现超越,效率相对提升50%。
发布会上,科大讯飞重新定义万物智联时代的多模AIUI交互标准,在原有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。
超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。科大讯飞研究院院长刘聪现场和超拟人数字人玩了个“人物扮演”游戏,无论是扮演孙悟空还是小猪佩奇,数字人反应都惟妙惟肖。
“目前,讯飞星火支持用户创建自己的个性化数字人,打造每个人的数字分身。”刘聪现场演示了一个自己的“数字分身”,只需在后台进行简单的编辑、定义,就可快速生成自己的卡通形象,更能一句话复刻自己的声音作为发音人,随时随地与自己对话。目前,已支持1300+种人设打造。

科大讯飞董事长刘庆峰发表演讲
首发星火多语言大模型
在语音识别领域,科大讯飞的远场高噪场景语音识别领先优势进一步扩大。
在多语言能力上,首次实现全国地级市方言全覆盖,含全国288个地市、202种方言,讯飞输入法14.0即将支持202种方言免切换自由说。
在多语种能力上,首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种。
多模态多语言能力升级,将全面赋能汽车产业。科大讯飞还首发了汽车端侧星火大模型,据悉,今年第四季度起,奇瑞、广汽、长城等多款搭载端侧大模型的车型将上市开售。

大模型赋能民生刚需
“用人工智能技术解决社会刚需”,是科大讯飞一直以来的出发点之一。此次科大讯飞全球开发者节上,科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300+应用场景。
为了帮助各行各业更好地落地大模型,科大讯飞构建了从“建算力、理数据、训模型,到落场景、保安全、精运营”的全套解决方案。“科大讯飞有领先的工具链,可大幅提升‘理数据、训模型’的效率;有覆盖300+行业场景的实际应用案例,已形成相互借鉴和复用的规模化效应;还有全国产化的算力平台。”刘庆峰说。
只有生态的繁荣,才有人工智能的大未来。根据IDC研究报告和市场公开数据显示,科大讯飞在语音语义市占率中第一、大模型开发者规模第一,达78.1万。据悉,科大讯飞将牵头成立AI基金,用5亿创业基金推动开发者创业,加速前沿技术产业化进程,并与地方政府联合为AI创业团队提供产业落地支撑。