美国当地时间2月14日-16日(北京时间15-17日),IBM超级电脑“沃森”亮相美国最受欢迎的智力竞猜电视节目《危险边 缘》,挑战该节目历史上两位最成功的选手——肯·詹宁斯(Ken Jennings)和布拉德·鲁特(Brad Rutter),看一看“沃森”能否在这档最抽象的文字游戏中击败最优秀的人类,同时展示这台超级电脑在其他领域的自然语言处理能力。这也是15年前 IBM的超级电脑“深蓝”战胜国际象棋世界冠军卡斯巴罗夫的又一次人机大战。
以下为人机大战首日的精选问题详解:
问题类别:甲壳虫和人(beatles people)(注:该类别问的是甲壳虫歌词中提到的人物)
• 问题:“任何时候当你感到痛苦,嘿”谁,“请打住,不要把整个世界都背负在你自己的肩头”(注:其中引 号中是原歌词,“谁”则是被问的出现在歌词中的人) (“And anytime you feel the pain, hey " this guy "refrain, don't carry the world upon your shoulders")。
• 答案:Jude。
• 点评:由于机器的知识库里包含了大量的明星歌词,而且调出这些歌词很快,因此机器在这类问题上占了上风。这是甲壳虫乐队Hey Jude歌曲的歌词,这个“谁”正是Jude。完整的歌词是:任何时候当你感到痛苦,嘿Jude,请打住,不要把整个世界都背负在你自己的肩头。
对于这题,沃森计算出答案是Jude,并且认为其可靠性高达98%,抢答成功。如下图所示:

沃森计算出答案是Jude
这里需要给大家解释一下,上图屏幕下方显示的是沃森对每道题计算出的最有可能的三个答案以及每个答案的置信度。中间白色的线代表了沃森当前 的置信度阈值。超过这个阈值沃森就会抢答,否则则不会抢答。比赛节目播放时,这些信息显示在观众的电视机屏幕上以帮助大家了解沃森想到了什么。现场比赛的 选手是看不到的。
问题类别:奥运奇闻(olympic oddities)
• 问题:米洛拉德•查维奇几乎破坏了这个人的完美2008奥运,仅仅输给这个人百分之一 秒。(Milorad Cavic almost upset this man's perfect 2008 Olympics, losing to him by one hundredth of a second)
• 答案:菲尔普斯。
• 点评:这是关于咱北京2008奥运中的一个问题。首先通过题目,沃森可以分析出,答案是一个人。虽然题目中没有提到游泳,但是沃森可以从百分之一秒,米洛拉德•查维奇,2008奥运中找到线索,所以沃森回答了菲尔普斯。
• 问题:1976年,在一个“现代”什么的项目中,一位选手因为在他的重剑和计分点之间作了手脚,能够在 没有触碰到对手的情况下得分,而被驱逐出该项 目。(A 1976 entrant in the "modern" this was kicked out for wiring his epee to score points without touching his foe)
• 答案:现代五项。
• 点评:这题仍然属于奥运奇闻类别,所以应该是个奥运项目。名字和“现代”相关。我们之前提到过沃森阅读 过大量的信息,并做统计分析。这里派上了用场。在所 有沃森的备选答案中,只有“五项”和“现代”搭配在一起概率比较大。再结合其它的线索,沃森正确回答了此题:现代五项,包括跑步﹑骑马﹑游泳﹑击剑和射 击。Bingo!我们的沃森再一次得分。在该题后,沃森以5800的高分领先另外两位选手。
• 问题:这是生理的奇观,1904年,美国体操运动员George Eyser赢得了双杠的金牌。(It was the anatomical oddity of U.S. gymnast George Eyser, who won a gold medal on the parallel bars in 1904)
• 答案:他少一条腿。
• 点评:注意这可是一个$1000美金的问题哦。Ken抢到了第一次,给出的答案是 “他只有一支手”,答错了。沃森抢到了第二次,给出了“腿”作为答案,也不对。沃森回答的是腿,而不是George Eyser少了一条腿。“奇闻”是一个比较主观的词,对于缺少主观意识的计算机是很难判断什么是奇闻的。他不仅需要知道Eyser少了一条腿,还需要知道 这是一件奇闻,这是很困难的。仅仅回答“腿”是不对的。
问题类别:请说出年代(name the decade)
• 问题:迪斯尼乐园开张&和平标志被创建(Disneyland opens& the peace symbol is created)
• 答案:二十世纪六十年代 (1950s)。
• 点评:这个类别的问题人类很熟悉,他们知道答案肯定都是年代。所以在没有听完问题的时候,人类就准备抢 答了。而沃森要在计算出答案后,才去抢答。所以即便 沃森可以找到正确答案,但是抢得没有人快。还有,这一组题目都给出了两个线索,导致计算量比较大,导致沃森的速度没有人类快。
虽然沃森找到了答案,但Ken抢到了该题,下图中,Ken的白色抢答灯已经亮起:

Ken的白色抢答灯已经亮起
• 问题:第一个现代的填字游戏发布&奥利奥饼干出现(The first modern crossword puzzle is published & Oreo cookies are introduced)
• 答案:二十世纪二十年代(1910s)。
• 点评:Ken先回答了三十年代(20s),主持人说答案不正确。沃森又抢答说三十年代(1920s)。 沃森不能听或看到Ken之前20s的错误答案,因此 把错误答案1920s又报了一遍。在我们设计沃森的时候,觉得分析对手的错误是不需要的,没想到啊没想到,沃森也会犯和人一样的错误。难怪沃森回答问题的 时候总是像“旁若无人”一样:)
问题类别:最终前线(final frontiers,注:该类别的问题答案或谜面中包含了最前最后之类的极限词)
• 问题:来自拉丁语,意思是”end“,火车也可以从这里出发。(From the Latin for "end", this is where trains can also originate)
• 答案:英文单词terminal。
• 点评:问题里面包含了多条线索,机器有时候只利用了其中某些线索,而忽略了一些其他的线索。比如此题中只很好的利用了拉丁语"end"这条线索,导致沃森 回答了错误答案finis。而起到了关键性的“火车也可以从这里出发”却没有用到。沃森把带双引号的作为更重要的线索了。
• 问题:这个“事件”不需要凭票入场;它是黑洞的边界,任何物质都不能从那里逃脱。(Tickets aren't needed for this "event", a black hole's boundary from which matter can't escape)
• 答案:事界(Event Horizon,用称视界,事件穹界,事象地平面)
• 点评:“事界”是一个相对论中的概念。但问题中故意加入了一些诸如“凭票入场”之类的误导信息。机器需 要不被其迷惑,正确理解“event”在此并不是指 一般意义上的“事件”,而是包含“事件”字符的其它概念。答案“事界”(Event Horizon)正好包含了事件(event)这个词,同时又和黑洞的内容一致。如果沃森纠缠于是否“凭票入场”,那就怎么也找不到答案了。令人高兴的 是,沃森找到了此题的重点在于黑洞。成功解答此题。太棒了!沃森,你什么时候成为物理学家了?!
• 问题:这是米开朗基罗画在西斯廷小礼拜堂里的一个壁画,它描绘了被救赎的和被诅咒的人。(It's Michelangelo's Fresco on the wall of The Sistine Chapel, depicting the saved & the damned)
• 答案:最后的审判
• 点评:西斯廷小礼拜堂里以米开朗基罗的两幅画“创世纪”和“最后的审判”而闻名。沃森需要仔细的区分到 底应该回答哪一幅画。沃森通过各种其它知识源得知, 虽然“创世纪”是一个穹顶画,也是一种壁画,但没有“最后的审判”是壁画来得直接,而且内容上“最后的审判”更接近“描绘了被救赎的和被诅咒的人”。所以 沃森选择回答“最后的审判”。这是沃森综合来自多个知识源的证据综合判断和区分答案的一个例子。
下图中,我们可以看到,沃森关于“最后的审判"的置信度为97%,而”创世纪“的置信度仅为15%。

沃森关于“最后的审判"的置信度为97%
问题类别:其它释义 (alternate meanings 注:该类别给出了某个单词的其它释义,请说出该单词)
• 问题:极有风度的高雅,或者所有同一年毕业的学生(Stylish elegance, or students who all graduated in the same year)
• 答案:英文单词class。
• 点评:class 既有品味、高雅的意思,又有表示一个班级的意思。这道题沃森回答错了,沃森给出的答案是chic。chic只有品味,高雅的意思。这道题的问题有两条线索,沃森给了第一条线索比较高的权重,而忽略了第二条导致了错误。
问题类别:文学作品人物APB (注:APB在美国警方往往指被通缉的人,这里潜在说明文学人物是反面人物)
• 问题:通缉罪犯,最近一次在巴拉多塔出现; 这是一只巨眼, 伙计们,你们会找到它的. (Wanted for general evilness; last seen at the Tower of Barad-Dur; it's a giant eye, folks, kinda hard to miss)。
• 答案:索伦。
• 点评:通过问题中的关键线索,沃森可以找到相关的知识。比如通过巴拉多塔(Tower of Barad-Dur)找到魔戒这部作品。其次,沃森要将眼睛和罪恶联系起来,在魔戒中找到相应的角色。巴拉多塔出现在魔戒中,罪恶的巨眼因此是索伦之眼。答案是索伦。
这是当天的最后一道题,沃森抢答后,Ken已经失望的低下了头。

沃森抢答后,Ken已经失望的低下了头
沃森靠着正确答对最后这道题,成功追平Brad。Brad在最后一刻被追平,略感失望。、
相关阅读:IBM超级电脑人机对战实录