摘要

学习能力是人类智能的根本特征.2016年3月,Google公司的Alpha Go把深度神经网络与蒙特卡罗树形搜索结合起来,以4胜1负的成绩战胜了围棋世界冠军韩国的李世石.这一结果标志人工智能取得了重大进展.本文重点介绍Alpha Go采用的机器学习方法,包括强化学习、深度学习、深度强化学习,分析存在的问题和最新的研究进展.为了突破通过计算机进行学习的极限,提出认知机器学习,列举可能的研究方向开展研究,使机器智能不断进化,逐步达到人类水平.