在演示中,这个火柴棍一样的小人自动完成了所有的动作。跳跃、躲避和下蹲,所有这些动作都是计算机自行设计的行为,并且获得从A到B的最佳途径,而DeepMind的程序员要做的,只是给配备一组虚拟的传感器,然后触发使其前进。
研究人员正在探索如何让人工智能机器人在复杂的环境下进行复杂并且正确的动作。一般而言,强化学习产生的行为很脆弱,从一个熟悉到不熟悉的环境中,往往很难适应。比如一个会在家里爬楼梯的婴儿,却无法自己学会乘坐电梯。
而现在这项研究证明,通过强化学习技术可以使人工智能系统处理更复杂的运动。