四川在线记者 高杲 尹梦奇 制图 施舒
2022年底,一则“AI创业公司Open AI推出ChatGPT”的消息让成都明途科技有限公司首席技术官严帅彻夜难眠。
“很久没这么激动过了。”严帅说,这款叫大模型的应用不像搜索引擎这样耗费大量时间去拆解信息,而是具备了一定的抽象思维能力。“与以往任何一款人工智能应用不同,大模型更像科幻电影里的人工智能,它将引领未来产业的发展。”
预感很快成为现实,在ChatGPT问世不久,谷歌、Meta、亚马逊、百度、阿里等企业先后加入,成百上千个大模型如雨后春笋般涌现,生成式人工智能遍地开花,一时间,文本生成、文生图、语音处理、代码处理、视频处理等应用产品海量井喷。
图为部分四川行业垂直大模型企业
抢占人工智能发展机遇,企业忙着“百模大战”,各地也开启大模型竞速战,北京、上海、广东、浙江等地推出大模型扶持政策,完善发展所需的配套支持。
在这场竞速赛中,四川的企业也没有置身其外,不过他们大多没有选择通用大模型、基础大模型作为赛道,而是立足自身基础和产业优势,聚焦行业垂直大模型发展。近两年时间过去了,这些分布在智能制造、文化旅游、医学诊疗等领域的大模型成长情况如何?遇到哪些问题?未来又该如何发展?近日,记者走进这些大模型企业,一探究竟。
涌入浪潮 破解行业痛点
如果有一个投资未来的机会,你愿不愿意“赌”一把?这是较早一批进入大模型赛道川企面临的选择。
成立于2017年的成都考拉悠然科技有限公司是其中之一,走进该企业的办公大楼,墙面上标语简单明了:构建万物AI的美好世界。企业首席架构师谢治宇介绍,自成立以来,企业便聚焦人工智能核心领域成果实现转化。
“我们差不多在2020年进入大模型赛道。”谢治宇说,在传统人工智能模式下,如果研发一个应用,需要开发一个模型,这样成本太高,效果也不好。他以城市交通道路管理举例,如果要研发一个抓闯红灯的应用,那么它很可能不具备抓超速、违规变道的能力。“当时我们就在想,有没有一种可能,开发一个多模态的工具,可以同时解决几十到上百个任务,让AI研发从碎片走向集成化。”
与谢治宇有着相同感受的是严帅,他所在的明途科技在2019年研发了一款办公辅助机器人,方便用户在不同场景下的咨询工作。“但也有一些不足。”严帅说,在面对用户提问时,这款机器人会从数据库里面找寻对应答案,从而进行匹配,如果用户的意图表达不明确,或者需要更加定制化的答案时,机器人就很难满足用户的需求。“我们希望能够打造一款既能懂客户需求,又能根据客户需求给出定制化答案的智能机器人。”
2022年11月30日,ChatGPT横空出世,其强大的生成能力和广泛的应用前景,让更多人看到了人工智能产业跃升的可能。几乎同一时间,2022年11月25日,国家互联网信息办公室、工业和信息化部、公安部联合发布《互联网信息服务深度合成管理规定》,为人工智能信息服务划出“底线”和“红线”。
自贡灯会数字人
技术的突破和法律制度逐渐规范,让更多企业看到了未来发展方向。严帅说,ChatGPT出现不久,企业召开了一场内部会议,决定将此前的工作全部迁移到大模型上,后来他们推出了一款政府服务大模型MT-WorkGPT。“我们现在的很多产品都是基于这个模型打造,比如在自贡灯会期间,我们推出一款数字人,小到哪个入口人少,大到本届灯会有哪些亮点,它都知道。”
如同自贡灯会数字人一样,四川多个行业垂直大模型正在行业舞台上崭露头角,不断破解行业痛点。
他们中,有人通过大模型,提升了行业的生产效率——
走进成都数之联科技股份有限公司,一台台看似并不起眼的机器正在对各类工业品进行缺陷检测。“这是我们基于工业缺陷检测领域大模型打造的智能检测产品,可以帮助企业对工业品进行缺陷检测。”该企业董事长傅彦表示,这些产品检测准确率高达99%,可以帮助生产企业节约超八成的人力成本。
他们中,有人通过大模型,优化了行业服务质量——
“请帮我规划一条看雪景的线路。”文旅大会上,游客向数字化大熊猫“安逸”咨询,不到3秒钟,“安逸”就根据用户需求定制了游玩路线。该产品的制作方,四川川投智胜数字科技有限公司工作人员介绍,这款数字化大熊猫基于AI文旅大模型打造,不仅可以完成线路规划,还可以提供交通安排、住宿预订等服务。
他们中,还有人通过大模型,促进了行业创新发展——
7月28日,由国家超级计算成都中心、中国地震局地球物理研究所与清华大学联合开发的“谛听”地震波大模型正式发布。这款大模型的特别之处在于,它是一款“听”地震的“神兽”,可以用于地震信号识别、地震活动监测、大地震快速响应等环节,还将拓展到矿震检测、地下空间结构探测、海底地震检测等领域。
“行业垂直大模型的故事才刚刚开始。”科技厅相关负责人说,目前,四川已经汇聚了30多个行业垂直大模型,涉及智能制造、文化旅游、医学诊疗等领域,未来,将结合市场需求和资源优势,支持研发更多细分领域大模型。
超算中心。超算中心供图
成长烦恼 机遇和挑战
大模型发展如火如荼,但机遇和挑战并存。茁壮成长中的四川垂直大模型也有成长中的“烦恼”。
一些受访者提到,不管是通用大模型还是行业垂直大模型,其逻辑都是一样,就是给人工智能投喂一波学习资料,让它自己学习,训练出一个初始模型,然后让它做题,再用“标准答案”来检验,碰到做错的题就反向微调模型的参数,通过“预训练+精调”提升模型的准确率,当参数和数据规模达到一个质变的阈值,大模型会猛然“醒悟”,出现了“涌现”效应。
为此,一些企业不得不将大部分成本投入算力之中,以实现“大力出奇迹”。“大模型训练的时长或者创新的快慢,根本上取决于算力的大小。”一位从事智能制造行业垂直大模型的负责人告诉记者,他们训练成本七成用于算力,推理成本九成用于算力,每年光花在算力的成本就有上百万元。“但即使这样,我们的算力还是紧缺。”
比算力更让人头疼的是数据。“与通用大模型相比,垂直大模型更像一个‘专才’,需要足够丰富和高质量的垂直行业训练数据。”“本草智库”中药全产业链大模型技术负责人陈伟介绍,他们花了10多年的时间,建立了含2000余万个实体和超20亿个关系对的知识图谱,生成了一系列覆盖中药全产业链关键环节的数据,让大模型在中药种植、质量控制、药物研发等中药全产业链关键环节中具备了决策支持能力。
“但如果要实现问诊等交互功能,还需要对知识更深度的挖掘。”一位从事医学诊疗大模型的企业代表说,医疗行业的大量知识并没有在互联网上呈现,甚至很多都是医生经验性的认知积累,行业内擅长复杂推理的专家,其最具价值的思维框架、思维模式远未形成文档化或者数字化。“行业垂直大模型瞄准特定的行业和需求,但目前训练的数据来源主要来自互联网、社交、搜索等渠道,如果没法挖掘出这些‘隐性’数据,将限制大模型的训练效果和应用性能。”
如果说数据和算力是大模型的基础设施,那么训练则体现了更多“人”的因素。谢治宇认为,就训练大模型而言,参数的数量并不是最重要的,工程化过程中的调优才是真正的考验。“这些垂直领域不同类型的数据进来之后,需要人类专家总结成不涉及隐私信息的领域知识,‘合成’为大模型的‘专业教材’,才能研发出更有针对性的产品。”
全力竞速 赋能行业转型提质
经历了几年发展,从业者们既感到兴奋,又感到焦虑,兴奋的是,他们正在参与一场新的产业变革,焦虑在于行业真的太“卷”了。
从“卷”技术到“卷”价格再到“卷”应用,一个“卷”字背后,折射出的是大模型正从“星星之火”走向“燎原之势”,企业不断拓展创新边界,催生出新的消费需求。根据国家网信部门官网公示的信息,自2023年8月31日我国首批通过备案的人工智能大模型名单出炉以来,截至今年8月,全国已有188款大模型完成备案。
科研和产业力量“卷”进去,是为了在市场中赢得先机,渴望捕捉先机的城市“卷”起来,看中的则是大模型等技术突破所带来的生产力飞跃。
“争夺大模型,就是争夺下一个技术时代的基础平台。”四川省人工智能行业协会秘书长陈章说,从去年开始,北京、上海、广东等传统数字重镇纷纷入局,打响“大模型之都”的争夺战。他同时注意到,各地发展侧重各有不同:作为“大模型第一城”的北京,重点突破基础理论研究,鼓励开展大模型的创新算法和关键技术研发;算力硬件是上海的强项,正在加快建成具有区域乃至全国影响力的智能算力创新及应用示范区;广东则更聚焦大模型对实体经济的赋能。
成都智算中心
对于四川,不少受访者提到,要立足产业基础和场景优势,深耕垂直领域,形成在细分赛道的独特竞争优势。“从2014年成立以来,我们就专注于电商和线上零售领域人工智能客服这一细分赛道。”成都晓多科技有限公司政企业务总监宋建说,他们通过10年时间在细分赛道的坚持和发展,积累了关于商品、行业上下游、行业政策以及产品使用场景相关的海量领域经验和知识,这些经验和知识可以更好地为用户提供智能化和个性化的服务,进一步提升服务效率,降低服务成本。“我们比客户更懂AI,比大厂更懂业务。”
除了明细路径,还要搭建好生态平台。陈章注意到一个细节,四川有130多家大模型相关企业,但超过九成都分布在产业链的基础层,涉及技术层和应用层的上下游供应商相对缺乏。
但完整的产业链对企业至关重要。“四川各个环节都能做,但是能做精的不多。”严帅以上游技术举例,比如数字人形象,能做到高仿真级别的,四川很难找到。
从下游应用来看,数之联的市场也主要在省外。“作为一家四川企业,我们90%以上的客户都不是四川的,这不到一成的省内客户中,有些总部还不在四川。”傅彦呼吁,四川应聚焦应用层推出更多引导政策。
针对企业的成长“烦恼”和行业的短板,四川作出了一系列部署。比如针对算力成本问题,四川支持成都智算中心、超算中心扩容升级,加快建设阿里云等智算中心,在加快推动算力基础设施建设的同时,还构建算力调度体系,提升算力资源利用率。再比如在高质量数据集“供不应求”问题上,四川正推动政务、教育、医疗、交通等领域公共数据搜集建设,并鼓励企业基于业务数据积累,开发智能制造、智慧文旅、清洁能源等重点领域高质量数据集,推动不涉及隐私和公共利益的数据市场化交易。
“此外,我们也要在产业链上做文章。”科技厅相关负责人表示,在技术层方面,四川将围绕重点行业应用需求,推动主流通用大模型全国软件工程总部、生态产业中心等项目在川加快落地;在下游应用层上,将推动大模型在制造业、服务业各环节融合应用,赋能千行百业转型提质。“定个目标,力争在2027年,打造超过10个具有全国影响力的行业标杆大模型。”