比不过阿尔法狗, 为什么还要学围棋?
撰稿|刘姝钰
可曾记得两年前那场被载入史册的棋局?
2017年5月27日,中国乌镇,棋盘一端是柯洁,另一端是阿尔法狗(AlphaGo)。聚光灯下,意料之中,柯洁零比三输掉了这场人机对弈。
可曾记得二十二年前,还是人机对战,同样地,人类输。1997年,棋王加里·卡斯帕罗夫与计算机程序“深蓝”对弈国际象棋,最终棋王以2.5:3.5(1胜2负3平)的战绩输掉了比赛。
围棋的复杂性要远大于国际象棋,也曾被认为是人类最后的智慧堡垒,现在却因人工智能的侵入变得摇摇欲坠。
刚刚过去的3月27日,人工智能专家杰弗里·欣顿和另外两位“深度学习”倡导者荣获2018年图灵奖,这一奖项被称为“计算机界的诺贝尔奖”。而曾经横扫围棋界备受瞩目的阿尔法狗就得益于“深度学习”,这让当年的人机对弈再次被提起并被热烈讨论。阿尔法狗就像一个推手,把围棋推向了人们的关注的焦点,推向了新的历史舞台,围棋竞技的技法、世界理解围棋的角度,都在这之后慢慢发生了改变。
计算机赢了,胜利者还是人类
阿尔法狗取得胜利后,很多人问,“未来人类棋手是否有战胜机器的可能?”答案是否定的。在纵横经纬19 ×19条线段分成的361个交叉点上,每一步棋子有大约200种走法,据推算,棋盘上可能出现的局面不会少于10的600次方种,若干步骤后,每一步走法可能带来的局面将会是天文数字。
从古至今,未曾出现过两盘一模一样的棋局。因此,通过暴力穷举法的手段预测所有可能出现的情况,并不适用于灿若宇宙星辰的围棋世界。围棋是一个博弈的过程,双方都企图寻找到全局最优解。
人类所采取的方法就是在不断的实战与死活题中寻找并积累经验。阿尔法狗也“仿制”了这样的经验录入方式,借助深度神经网络、监督/强化学习、蒙特卡罗树搜索三大秘诀,既可以像人类一样,通过实战不断录入经验,根据海量结果生成新范式,优化每一步落子,又因其强大的信息存储和计算能力超越人类,并能进行仿真运算,不断模拟可能性直至最终胜利——一句话,比你优秀(计算快且准)的人,还比你努力(大量数据的录入)。
但其实,阿尔法狗只是还原了围棋的本质,围棋是一项决策游戏,目的是寻找最优解。人类受传统经验的限制,对一些固定套路深信不疑,对一些奇招、险招不敢轻易尝试。而一心只想取得最终胜利的人工智能,通过无数次模拟可能出现的最终局面,往往会采取当局人无法理解的走法。
这一现象也出现在柯洁与阿尔法狗的对战上。与阿尔法狗的战斗无疑也开启了柯洁新的围棋思维。在此后的一场比赛中,柯洁对战韩国世界冠军元晟溱时火力全开,各种“阿尔法狗流”的招法跃然盘上,最终取胜。柯洁用“震撼”来形容阿尔法狗带给围棋界的感受,但同时也表示人类还会变得更强,而他也通过自己的不断蜕变,印证着这句话。在人机大战赛后,已经加入DeepMind团队的棋手樊麾宣布,DeepMind将公布阿尔法狗50盘自我对战棋的棋谱。
在不断厮杀的围棋赛场上,人工智能的加入带来了鲇鱼效应,搅动棋手寻找更新、更奇的黑白布局。当然,对于人工智能而言,一盘棋结束了就结束了,但对于人类而言,却享受了走子奥妙带来的乐趣。
毕竟,追求更强,比追求胜利本身更加动人。
阿尔法狗赢了,可惜它体会不到愉悦
如果单纯把围棋当作一项只有胜负价值的竞技项目,那人工智能的胜利将永远变成笼罩在围棋上空的乌云。
中国古代的传统游戏有很多,例如将棋、叶子戏、双陆、樗蒲等,但大多数已逐渐消亡,唯有围棋传承至今不衰并发扬光大,从日韩到欧美,围棋都得到了传播和重视。日本畅销动漫《棋魂》影响了几代青少年重新认识围棋,并因此对围棋产生浓厚兴趣。韩国高分电视剧《请回答1988》中,也将主角之一设定为天才围棋少年。不得不说,在世界弈棋文化中,围棋一直保持着它独有的优越性。这种优越性,单靠其竞技性是无法达成的。围棋演变至今经历的悠久历史以及文化内涵,赋予了它与生俱来的艺术性。
自唐朝开始,围棋与古琴、书法、绘画并称“琴棋书画”,后人将“琴棋书画”称为君子四艺。古人将围棋视为艺术,工整的棋盘、圆润的棋子、优雅的对局室、清脆的落子声,还要伴之绝美诗句。“绝艺如君天下少,闲人似我世间无”“有约不来过夜半,闲敲棋子落灯花”……围棋挣脱竞技的桎梏,上升为一种意境的感官体验。棋圣聂卫平曾经讲过,围棋可以看作是中国文化、哲学、艺术、智慧的伟大结晶,围棋的每一处美都体现了中国文化之美。
而对于人工智能而言,赢棋是最终目的,下棋是达成目的的手段。在柯洁对战李世石的梦百合杯决赛上,曾有这样一条网友评论:从双方的失误中,我们看到了职业大赛的残酷,看到了纹枰上燃烧的烽烟、听到了黑白子力间刀来剑往的杀伐之声,正是这无形的血与火,给了二位对局者以常人难以承受的巨大压力……这个时刻,他们全部身心都已牵连着棋盘,包括每一个汗毛孔,这与其说是在下棋,不如说是在决斗!可以看到,在围棋的赛场上,有“一夫当关,万夫莫开”的角地抢占,有“进可攻退可守”的安营扎寨,有“进退维谷”的险局突围和弃子战略。
在AlphaGo强势打入围棋世界后,我们反而可以回头审视初心,更清楚地看到在无情的厮杀下,却是百转千回的对战思绪,在高超的技术背后,我们还需要艺术的浸淫。
我们常说,“人生如棋,棋如人生”,对于阿尔法狗而言,每一场对战的胜利只是丰富了它进一步学习总结的数据库。与此相反,人生无法仅用几个数据概括,围棋就像微缩的人生,你在这个四方天地经历种种选择,每一种选择都可能导向一个截然相反的结果。
磨砺与求胜,就是棋手的修行。