2.7 符号主义的最后辉煌
在第二次AI寒冬中,IBM 的“深蓝”计算机通过强大的暴力搜索和算法优化,在国际象棋比赛中击败了世界冠军卡斯帕罗夫,成为符号主义的最后辉煌。然而,这场胜利也凸显了符号主义的根本局限:它仅在规则明确、状态有限的封闭环境中有效,无法推广到更复杂的现实世界问题,预示着这条技术路线的终结。
在第二次人工智能寒冬来临之际,1985 年,卡内基梅隆大学的 许峰雄(Feng-hsiung Hsu) 主导开发了一个国际象棋程序 ChipTest,后升级为 “深思”(Deep Thought)。
1989 年,许峰雄加入 IBM 研究院后继续优化并行计算技术,目标是击败当时的国际象棋世界冠军 加里·卡斯帕罗夫(Garry Kasparov)。
1992 年,IBM 成立专项团队,由谭崇仁领导,开发专门用以分析国际象棋的系统,并将系统命名为 “深蓝”(Deep Blue)。
1996 年,深蓝第一次挑战以 2:4 败于卡斯帕罗夫,但 1997 年 5 月 7 日,在纽约曼哈顿的费舍尔大厦中,深蓝再次挑战卡斯帕罗夫,最终以 3.5:2.5 获胜。这是计算机第一次在正式比赛中战胜人类世界冠军,全球数亿人通过电视直播见证了这个历史时刻。媒体沸腾了,IBM 股价应声大涨,人们惊呼“人工智能的伟大胜利”。
但这场胜利的背后,却完美体现了符号主义的根本局限。比赛胜出后,IBM 立即拆解了深蓝并宣布其退役,这个举动本身就说明了问题所在。
深蓝可以说是符号主义理念的完美实现,它的工作原理完全符合“ 人工智能=符号操作+逻辑推理 ”的核心思想。
做法也很简单: 暴力搜索+算法优化。
对于棋盘游戏,我们可以简单用两个概念来衡量其复杂度:
- 状态空间复杂度(一盘棋中所有可能的合法局面数)
- 游戏树复杂度(一局完整游戏中所有可能的走法序列数)
以最简单的井字棋为例,在大小为 3×3 的 9 个方格中,先手画圈,后手画叉,每人在空格中落子,谁先连成一行(列、斜线)3 个就获胜(如图2-6)。
图 2-6 井字棋示意图
每个格子包含空白、圈、叉3种状态,3^9=19,683,这就是理论上井字棋有可能出现的所有符合规则的局面数(如图 2-7),也就是状态空间复杂度,考虑到游戏的结束条件是连成线获胜,可能没有列举完就获胜结束了,所以实际上的状态空间是小于这个理论值的。
图 2-7 井字棋部分局面
我们用 A、B 标识两个玩家,A 画圈先落子,B 画叉后落子,A、B 交替落子为一轮,用序号 1~9 标识游戏九宫格,井字棋的游戏树(如图 2-8)。
- 第一轮,玩家A有9种选择,玩家B有8种选择
- 第二轮,玩家A有7种选择,玩家B有6种选择
- 第三轮,玩家A有5种选择,玩家B有4种选择
- ……
图 2-8 井字棋游戏树示意
通过这样的方式就可以计算出来某个玩家走的每一步接下来另一名玩家的应对策略有多少,这就是暴力穷举法,通过计算,排除无效路径(如一方已获胜仍继续下棋)和对称重复状态后,井字棋的游戏树大约是 26,830,也就是 26,830 种可能的游戏路径。
对于井字棋这样的简单游戏,现代计算机可以瞬间找到完美策略,但是如果我们换为国际象棋,那么状态空间复杂度约是 10^47,游戏树复杂度约是 10^123(远超可观测宇宙的原子数量 10^80),计算机根本没办法完整的计算完,穷举基本不可能。
深蓝巧妙地将暴力穷举的思路扩展到了国际象棋这个复杂得多的领域。它每秒可以计算 2 亿个棋局位置,然后向前搜索 12~14 步的所有可能走法。除此之外,深蓝还预设了 70 多万个已知的开局变化和残局定式,甚至针对卡斯帕罗夫的个人风格进行了特别优化。因此,深蓝赢了。
但深蓝的成功恰恰暴露了符号主义的根本局限:它只能在规则明确、状态有限的封闭环境中工作。
国际象棋虽然复杂,但它有固定的规则、有限的棋盘、明确的胜负判断标准。而围棋的状态空间复杂度约为 10^171,游戏树复杂度更是达到了 10^360,这个数字已经超越了人类的理解范围。更重要的是,围棋的“势”“厚薄”“形状”等概念,很难用精确的数学公式来表达,需要大量的模式识别和直觉判断。
深蓝的胜利可以说是符号主义的最后辉煌,也是它局限性的完美展示。它告诉我们:在特定的、规则明确的领域,符号主义可以做得很好,但要实现真正的通用智能,我们需要全新的思路。
Last updated on