80老翁谈人生（291）：揭开沃森超级电脑的神秘面纱_北大袁萌

http://blog.sina.com.cn/u/1317372297

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

80老翁谈人生（291）：揭开沃森超级电脑的神秘面纱

(2016-12-19 00:43:51)

80老翁谈人生（291）：揭开沃森超级电脑的神秘面纱

当今，国外媒体掀起鼓吹IBM沃森超级电脑的狂浪，每天新闻不断。沃森超级电脑是什么“神物”？它的工作原理如何？

2016年6月，美国知名人工智能专家James Hendler教授（1957- ）应邀在国际人工智能大会（IJCAI 2016）上深入浅出地讲解了沃森超级电脑的工作原理，值得一读。

他说：我们把沃森超级电脑设想为一间环形办公室走廊，每一间办公室都有一群人做着特殊的工作，让我们从头来梳理整个运行过程。

问题输入（QUESTION IN）

问题分析（Question Analysis）

这个问题什么意思？

我们在找什么？

还存在其他有效信息么？

问题中有没有词语提到问题中的其他词语？

在这一环节，IBM的DeepQA软件自动尝试去理解这个问题，搞清楚问题到底在问什么，同时做一些初步的分析来确定选择哪种方法来应对这个问题。

初步搜索（Primary Search）

在数据库中能不能找到或许跟这个问题有关的文件？

找到了多少文件？

这些文件从哪里来的？

搜索结果处理并生成备选答案（Search Result Processing and Candidate Answer Generation）

在这些文件中，有这个问题可能的答案么？

有多少个备选答案？

当问一个问题时，一份文档就打开了。文档在办公室中不断移动时，更多信息被添加进去了。

上下文无关回答得分（Context-Independent Answer Scoring）

这个选择有可能是正确的答案吗？

这个选择是正确的答案形式吗？

软滤波（ Soft Filtering）

有哪些选择是明显错误的？

如果是的话，能不能让它们在后面的处理过程中不占太多的时间？

每个可能的回答都被给定一个分数，给出这个证据对备选答案支持得到底有多好。

支持证据检索（ Supporting Evidence Retrieval）

能在数据库中找到任何能够证明某个选择答案是正确的信息吗？

对每个选择来说有多少信息在哪？

搜索结果处理和上下文相关得分（Search Result Processing and Context Dependent Scoring）

选择工作作为问题回答怎么样？

现在有更多的信息，能给每个选择什么分数？

最终合并并排名（Final Merging and Ranking）

每个选择的总分是多少？

哪个选择分数最高？

分数第二高的选择是什么？

还有任何能够改变分数的额外信息吗？

DeepQA也观察到了这种现象：不同的表面形式通常会被不同的证据支持，并得到完全不同但潜在互补的分数，这产生了一种方法：将答案分数在排名和信心计算之前先合并掉。

输出答案（ANSWER OUT）

有用的最高分答案被返回，然后沃森尝试判断从它做的多好（或者多坏）中进行学习。

由此可见，Waltson的工作原理就是“实事求是”，不是耍嘴皮子。

袁以

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：80老翁谈人生（290）：沃森超级电脑的运算能力

后一篇：80老翁谈人生（292）：沃森超级电脑与不确定环境下的推理

新浪BLOG意见反馈留言板　欢迎批评指正