昨天晚上去360做客老周的直播间,聊了聊纳米多智能体蜂群升级,很有趣,简单记录一下。
(跟Koji
@杨远骋Koji 和狗哥@一起围观纳米发布hh)
这次是Agent的一个迭代,在过往的多智能体协同的时候,经常会遇到信息传递与参数共享、上下文管理这几个问题,包括随着调用工具越多成功率就越低的这种现象。
纳米搞了个「蜂群协作框架」来解决这个问题,由中央指挥智能体或调度模块来负责拆解任务并安排给最适合的专家智能体,信息共享上通过“拉群”的形式来共享Context,还引入了多层嵌套和同步机制,解决这类问题;
最典型的一个案例case就是「一句话生成大片」,一次性生成3-10分钟的视频最大的难度在于一致性的保持和上下文的管理,涉及到任务规划-拆解-Agent之间的协同,再加上落地结果整合输出。
而从实测结果来说,一次性生成几分钟视频的成功率和稳定性还是提升了很多,不过也有待提升的地方,比如一致性的保持以及画质相关问题。
期间有一个观点是老周和大家都比较赞同的,就是「通用智能体」这个概念其实不太存在,或者说从大家已知的“什么都能做”,这是一种直观的通用性,很难实现;
而另外一个维度上来说,这里也引入腾讯研究院朋友的观点,所谓「通用」其实是面向人群的广泛普适性,
它的适用场景虽然不复杂,但受众面很广,比如找材料写研报、问答等日常需求,大多数上网用户都能使用,这种就是“通用”的。
大多数人其实很难像汗青老师那样拥有极强的美感和设计能力,再加上AI的赋能,对剧本、生图、图转视频等各个流程的熟稔于心,要求的门槛很高,这也是专业设计师的独特性
纳米的多智能体协作,把制作视频的成本无限拉低,通过意图理解、剧本创作大师、分镜脚本、剪辑、配音等等单个智能体协同搞起来,再加上一些循环模组,就能完成一个对普通人相对复杂的任务实现,在日常生活中来使用。
「降低使用门槛」是AI技术在推广全民过程中的必经之路。