BOSS来了丨腾讯副总裁蔡光忠：今后干等红灯的情况可能不会再发生了

四川在线记者唐泽文摄影报道

11月16日，由中国计算机学会主办，中国计算机学会人工智能与模式识别专业委员会、腾讯承办的2024中国多智能体应用大会在成都举行。

什么是多智能体？它能在哪些领域应用？为什么这场大会要选择在成都举办？四川在线记者专访了腾讯公司副总裁蔡光忠。

蔡光忠

四川在线记者：能不能先介绍一下多智能体到底是什么？

蔡光忠：字面意思其实已经给出了一个解释，多个智能体的协作。

多智能体是由多个相互作用、相互协作的智能体所组成的系统。智能体可以简单理解为一个能够感知环境、进行推理决策并采取相应行动以实现自身目标的实体，这些智能体在多智能体系统中共同存在、协同运作。

比如人就是一个智能体，我们做的许多事情，事实上就是多智能体协作。

当下人工智能技术发展很快，怎么让多个采用AI技术的智能体一起做好一件事情，这就是当下多智能体应用的研究和发展方向。

四川在线记者：当下看有没有具体应用的诞生？

蔡光忠：有的。回答这个问题前，我先聊聊我们的多智能体是怎么来的。

初衷其实很简单。《王者荣耀》这个游戏上线之初有个问题，经常有玩家掉线，游戏角色站在那儿不动了，影响游戏进程。

其实竞技游戏就是最直接的多智能体博弈，红蓝两组，每组5个玩家进行5v5对抗，每个玩家就是一个智能体。

有玩家掉线不动了怎么办，我们用AI智能体替代这个掉线的玩家来控制游戏角色，与自己的4个队友继续配合进行比赛。

这就是我们多智能体技术诞生的最初目的。

但没想到的是，用来发展这项技术的“开悟”平台，受到了国内几乎所有知名院校的关注，大家就一起加入了进来，在各个可以用到多智能体技术的领域进行开发。

现在这项技术的应用领域就很广了。理论上看，只要是需要多智能体配合协同的场景，都可以用它来完成。目前已经在交通、电力，甚至是卫星群控制的领域，都有应用。

四川在线记者：能不能举一些具体的案例？

蔡光忠：在成都天府三街，我们就和西南交大的团队合作，通过多智能体技术，提升交通通行效率。

这么看这个问题——每一辆车、每一个行人都是一个智能体。一套强大的交通管理系统，应该根据这些智能体的实时状态、动作、预期目的来进行实时调整。每一侧路口，有多少人和车，他们想干什么？交通系统根据这些状态实时作出反应。是不是很像在玩游戏？

交通管理系统“玩”得好了，就不会出现你在等一个红灯，但横向车道上根本没车也没人通行，完全是在“干等”的情况。

现在许多交通路口仍会出现这样的状况，就是当下的“经验模型”还不够优化的结果。开发这项多智能体应用，就是为了解决这个问题。

再比如，我们正在做的一套群体卫星控制系统。以前我们需要人为地控制每一颗卫星，去完成从规定的各个角度拍摄某一对象的工作。现在每个卫星都成了智能体，它们之间知道应该如何相互配合完成拍摄，人都不用管了，效率和质量都更高。

四川在线记者：发展多智能技术当下有什么困难或者瓶颈？

蔡光忠：最大的瓶颈还是在算力上。多智能体的训练主要依靠强化训练来完成。

这里解释一下强化训练的概念：它不像传统的学习训练方式——有一套系统的教学模式，告诉训练对象具体每个场景下，每一步应该怎么做。而是通过神经网络技术，让智能体直接去做。做出来的成果好就告诉它做对了，成果不好就告诉它做错了。它进行了海量次数地做之后，自己就知道该怎么做了。

其实，它具体是怎么学会做的，是一个“黑匣子”，我们研发人员也不知道。但事实看，这种方式训练出来结果是最好的，所以多智能体当下都依靠强化学习来完成训练。

但强化学习的核心，就是得让它做的次数达到海量。这需要很大的算力资源进行支持。我们现在也正通过各种途径解决这个问题。

四川在线记者：为什么选择在成都召开这次会议？

蔡光忠：其实多智能体技术发展的瓶颈除开算力之外，另一个就是人才。这也是我们选择在成都落地这场会议的原因。这里有优质的高校资源。此前我们举行的一场面向全球的多智能体博弈比赛中，电子科大团队的最终评分就遥遥领先获得第一。另外成都的软件产业发展在全国独树一帜，上下游配套更顺畅。

把目光放到全省看，四川产业门类非常齐全，且企业对数字化升级的需求也较高，我们研发的各类应用场景更容易落地，这对研发侧来说十分重要。

编辑推荐

视觉焦点

排行榜

BOSS来了丨腾讯副总裁蔡光忠：今后“干等”红灯的情况可能不会再发生了