谷歌近期推出了一项革命性的AI系统——Agents SIMA,这一系统专为在多样化的3D游戏环境中自主行动而设计。通过理解自然语言指令,SIMA可以在不同的视频游戏场景中执行各种任务,展示出AI在游戏世界中的潜力和灵活性。
技术特点和目标
SIMA的主要目标超越了简单地在游戏中获得高分,它旨在理解并执行多种游戲环境中的自然语言指令,推动开发更通用、更实用的AI系统。为了实现这一点,谷歌的DeepMind与多家游戏工作室合作,在9种不同类型的游戏中训练SIMA,从而增强其对不同虚拟环境的适应能力。
SIMA由两个核心模型组成:一是负责精确的图像-语言映射,二是用于预测接下来的画面变化。这两个模型都经过了针对特定3D游戏环境的微调,使得SIMA能够通过简单的游戏画面和语言指令交互,用键鼠操作控制游戏角色。
技能与未来发展
到目前为止,SIMA已经掌握了600项基本技能,并期望未来能够执行更为复杂的任务,比如资源采集、营地建设等,这不仅要求其具备战略规划能力,还需要能够拆解并执行子任务。SIMA的发展标志着以语言为驱动力的通用AI代理的一个重要方向。
展望
随着SIMA在更多环境中的训练以及模型性能的不断提升,它有望发展成为一个更加全能和智能的AI助手。从游戏世界的互动拓展到现实世界中的各种复杂任务,SIMA的探索不仅为AI技术的发展开辟了新的领域,也为未来人类与AI的交互方式提供了新的想象空间。谷歌通过Agents SIMA项目,再次证明了其在推动AI技术创新和应用探索方面的领导地位。