最近,一项由科研团队进行的创新性研究为人工智能领域带来了新的突破。他们成功地通过一种名为Video PreTraining(视频预训练,简称VPT)的方法,让神经网络学会了如何玩《我的世界》(Minecraft)。这项研究表明,借助大规模未标注数据集和少量标记合同数据,结合精心调优,AI可以完成需要熟练玩家耗费20多分钟才能完成的任务。
研究人员通过一个包含大量人类在《我的世界》中游戏录像的海量非标视频数据集对神经网络进行了预训练。然后,在微调过程中,这个模型学会了制作钻石工具这一任务。通常情况下,这需要熟练的人类玩家耗费超过20分钟(即24,000个操作步骤)才能完成。
更令人印象深刻的是,研究人员并未专门为AI设定复杂的游戏控制界面。相反,他们让模型使用了人类自然的交互方式——键盘输入和鼠标移动。这种设计使得该模型具有极高的通用性,并且是通向能够使用计算机的一般型智能代理的一大步。
这项研究不仅展示了视频预训练在训练AI用于复杂任务方面的潜力,还强调了如何更有效地利用大规模未标记数据来加速学习过程的重要性。通过这种方式,未来的AI系统可能会更加接近于人类的自然交互方式,并能够执行更为复杂的任务。
🔗 来源:Learning to play Minecraft with Video PreTraining (AI 严选)
推荐意见