川企大调研·聚焦新质生产力丨角逐文生视频“新赛道”,这家川企为何能“抢跑”?

2024-03-27 22:16:38来源:四川在线编辑:牛霄

四川在线记者  史晓露

调研企业:成都恒图科技有限责任公司

 

调研主题:川企如何竞逐文生视频“新赛道”

 

调研时间:3月下旬

今年2月,文生视频大模型“Sora”横空出世,引爆全网。

面对Sora卷起的技术浪潮,科技圈“摩拳擦掌”,不到两个月,国内外已有多家科创公司和互联网科技大厂下场布局。其中,一家四川企业已先行一步,早在1月底,成都恒图科技有限责任公司(下称:成都恒图)就在全球率先上线一站式AI长视频制作平台Clipfly,集合了AI视频生成、AI视频增强、视频编辑等功能,短短两个月,已在海外拥有10万名用户。

角逐人工智能新赛道,很多初创公司“拿着锤子找钉子”,先做大模型,再去找应用场景,但实际上很难落地。对于成都恒图来说,则是先找到行业需求,瞄准图像处理这个场景,再去用技术为行业赋能。

角逐文生视频“新赛道”,这家川企为何能实现“抢跑”?近日,由四川日报全媒体与省工商联共同组成的联合调研组,走进这家企业,寻找答案。

四川造AIGC产品,如何抢先一步?

3秒、6秒、8秒!短短两个月,Clipfly生成的视频片段时长不断被刷新,已超越业内大部分竞品。

“天下武功,唯快不破!谁先推出最好用的产品,谁就能率先抢占市场。”成都恒图创始人、西南财经大学教授、博士生导师段江雷厉风行,他透露,Clipfly全球首发后,保持了每周一更的迭代速度,目前公司正全力进行版本升级和产品内测。

成都恒图科技有限责任公司创始人、西南财经大学教授、博士生导师段江。受访者供图

把单纯的文字变成流畅的视频,Clipfly是如何做到的?

“输入文字提示词后,Clipfly先将提示词生成1—4张图片,也就是视频帧,再将图片生成3—8秒长的视频片段。”段江娓娓道来,生成足够的视频片段后,用户可以用Clipfly自带的视频编辑器,将素材加上字幕、音乐,剪辑为完整视频。他向调研组展示了一段编辑后的完整视频,长达41秒,包含细腻复杂的场景、生动的角色表情以及多个运动镜头,画面十分逼真。

不过,在做长视频的过程中,不同的视频片段可能出现场景和人物不一致的问题。“这也是行业的普遍难题,我们已经有一些解决方案去解决这个问题,而且很快会上线。”段江说。

此外,和“Sora”能直接生成1分钟的长视频相比,目前大部分科技公司的文生视频时长只有短短数秒。Clipfly的优势在哪里?

Clipfly界面。受访者供图

“Sora生成的只是原始素材,一段好的视频不只是生成,还要带有字幕、转场、配音、特效等元素,Clipfly自带视频编辑器,能将生成的视频片段剪辑成更完整的成品,这正好是Clipfly的优势。”段江说,而且Clipfly仍在视频时长上持续攻关。

尽管Clipfly还不算完美,但已收获了巨大关注,最近每周都有多家国内外投资机构主动找上门,其中不乏顶级投资机构。为什么公司能比别人抢先一步?

调研中,段江反复提及两个关键词——“技术”和“准备”。“在机会出现之前,公司已经做了10多年的技术储备。”早在2009年,段江就创立成都恒图,并在2012年推出图片处理软件“Fotor”,在图像处理上具备多个完全自主创新的技术,比如HDR(高动态范围图像技术)、单反相机原始图像文件AI技术、一键图像增强技术,部分技术已经拓展到视频领域,能生成高质量的视频内容。

其二,是对前沿技术的敏感。段江分享了一个小故事,2022年,公司就注意到国外扩散模型(Diffusion Model)技术的发展,意识到这种能根据文本描述生成图像的新技术,将对整个视觉行业带来巨大改变。

“当时很多人还没有关注到AIGC,直到2023年ChatGPT的大火。”段江说,但2022年10月,Fotor便上线了AI图片生成功能,吸引了大量用户。从2022年到2023年,Fotor的月活跃用户增长了六七倍,目前月活跃用户数已突破1500万,跻身全球头部AI图像产品。在一项国际权威数据公司对全球超过5000个AI应用的排名中,Fotor的用户数在全球排第23位,超过了百度、腾讯、阿里等大厂的AI产品,在所有国产AI产品中排名首位。

“图像和视频技术具有通用性,同时基于视频用户的需求持续增长,公司决定布局AI视频。”段江说,这么多年,公司埋头做技术、做产品,形成了一支有战斗力的团队,当一个大机会来临时,就能迅速抓住。

行业只烧钱难赚钱,川企如何逆势而上?

“Sora”的横空出世,也在电影、特效、游戏开发等领域引发连锁反应。不过,相比于去年ChatGPT带来的“百模大战”和投资热潮,今年,资本要冷静许多。

“从市场角度看,无论技术多好,如果不能变成市场接受的产品,就是一张废纸。”多位业内人士指出,当前很多文生视频模型还没有落地时间表,就连“Sora”也还在内测阶段。特别是去年投资圈已为“百模大战”付了“学费”,眼下自然更加谨慎。

调研组也发现,AIGC概念大火后,很多企业蜂拥而上,但由于技术不成熟、应用场景不清晰、数据隐私等问题,很多大模型都缺乏落地场景,很难实现商业变现。就连国外图像生成头部玩家Stability AI,最近也因商业化前景暗淡、财务状况压力寻求出售,核心团队离职“跑路”。甚至有风投机构预测,“85%的AI初创公司将在三年内倒闭。”

面对行业只烧钱难赚钱的困境,成都恒图却逆势而上,不仅有稳定的现金流,而且已实现盈利。

“一开始我们就不希望烧钱去发展,所以公司瞄准海外市场,主要靠订阅付费实现盈利。”段江解释,海外用户有更好的付费习惯,客单价在45—50美元/年,目前Fotor的用户订阅费已占公司收入90%以上。 正在推进的Clipfly也将采取这种模式,下一步将在国内上线,除了C端的大众用户,还会面向企业客户。

“大模型只是底层技术,还需要找到应用场景。”段江指出,现在行业内很多初创公司都是“拿着锤子找钉子”,先做大模型,再去找应用场景,但实际上很难落地。对于成都恒图来说,则是先找到行业需求,瞄准图像处理这个场景,再去用技术为行业赋能。

多位业内人士认为,成都恒图的发展路径值得借鉴。“狭缝创业才能真正获得快速成长。”电子科技大学教授、日本工程院院士、欧盟科学院院士任福继认为,AI从业者与其它行业交叉少,缺少跨行业思维,无法充分挖掘真实的行业应用场景,对此他建议,企业可以加强与高校、研究机构的合作,积极参与行业交流和合作,有针对性开发相关产品,解决行业真问题、刚需问题。

从全局来看,行业也容易脱实向虚,引发混战。对此,专家普遍认为,关键要靠“应用驱动”。“‘百模大战’,实际上会演变为‘千模混战’,四川要尽量避免。”任福继建议,四川可集中攻关一至二个基础大模型,其余分散开发应用赛道。

例如,四川在元宇宙、智能交通、智慧医疗、智慧文旅等多个领域已涌现出一批具有特色的应用场景。“下一步,可以寻找大模型能够发挥巨大价值的场景,引进和培育一批大模型应用的开发者,培养领军型的行业大模型解决方案提供商,用类似‘揭榜挂帅’的模式,遴选有意愿有能力的企业,开发行业大模型解决方案,在四川做出示范后,开展全国甚至全球服务。”任福继说。

    编辑推荐