川观智库研究员 饶雪琪
近日,腾讯研究院发布报告《大模型如何赋能传统文化传承发展?我们有10个关键思考》称,随着用户个性化需求增长、文化产业竞争加速、跨界融合需求愈发迫切,以及文化的国际传播影响力日渐增大,传统文化的传承发展,将更加需要行业大模型。
腾讯研究院将文化行业大模型定义为:针对文化行业需求(特指传统文化领域),采用传统文化相关专业数据进行训练,形成文化专用知识和能力的深度学习模型。应用范围主要包括中华文化遗产相关的保护、创作、生产、传播与消费等。腾讯研究院认为,大模型落地文化行业,需要推动语料提供者、技术开发者和场景应用方的三方关键主体融合共创。
从语料提供角度来看,传统文化数据具有数量“大”、种类“多”、质量“杂”、版权“广”等特点,如何保障文化行业大模型的语料全面、准确,在不影响各专有数据安全独立的条件下,推进各数据版权方加强合作,打破壁垒,需要探索“1+X”的传统文化专业语料库建设机制,1是政府推动建设的传统文化基础语料库,X代表掌握传统文化数据的文化单位或机构,并探索权益分配机制、本地化模型训练等模式支撑。
从技术开发角度来看,实现大模型应用合法合规基础上的价值对齐是实现文化价值、技术要素有机统一的保障,为了实现模型输出结果的负责性,避免虚假信息、歧视性和偏见问题、文化敏感性问题,需要从语料准备、算法设计、训练干预、用户交互和安全管控等全链路进行设计开发。
从场景应用角度来看,传统文化应用大模型技术呈现出新思维、新形式和新表达方式,但由于部分文化单位缺乏足够的数字化基础设施和技术能力,无法与大模型技术进行有效融合,以及实际文化业务需求和技术应用供给之间存在较大“认知鸿沟”等脱节现象。需要进一步鼓励文化单位与科技公司跨界合作和融合创新,形成大模型创新应用试点示范和经验推广,激发大模型与传统文化应用创新的市场端和文化端持续动力。