“要让多个智能体学会合作是很困难的,既要设定各个智能体的目标,还要分出主力和辅助关系,实现这样的复杂设计成本很高。”中国科学院自动化研究所兴军亮团队提出了一种自我提升式强化学习框架,先让智能体通过模仿来学习,再通过自我互博来进阶进化,加上他们提出的一种新策略,可有效缓解一些多智能学习的常见问题。
经过一年时间的实践,活动得到很好的成果,验证了王者荣耀游戏环境对人工智能技术的赋能思路。
助力产学研,共享AI+游戏新生态
上一篇:把握产业升级趋势 掌趣科技研发投入效果凸显
下一篇:新浪游戏专访LPL春季赛总冠军RNG战队选手Ming