最近的Dota 2比赛结果表明,通过自博弈(self-play)技术,人工智能系统可以在有足够的计算资源的情况下,从远远低于人类水平跃升至超人类水平。仅仅一个月的时间,我们的系统就在自我提升的过程中,从勉强能与顶级玩家持平到击败顶级职业选手,并且一直在持续进步。
传统的监督深度学习系统只能根据其训练数据集的质量达到一定的性能上限,然而在自博弈系统中,随着智能体变得越来越出色,它能够生成越来越多高质量的训练数据。这使得系统的整体性能不断跃升,远远超越仅依赖于初始训练数据的做法。
这种进步不仅展示了自博弈技术在人工智能领域的巨大潜力,也为未来的AI应用提供了新的可能。未来,类似的自我提升机制或许可以应用于更多的任务和领域,推动整个AI行业的快速发展。
🔗 来源:More on Dota 2 (AI 严选)
推荐意见