80老翁谈人生(291):揭开沃森超级电脑的神秘面纱
(2016-12-19 00:43:51)80老翁谈人生(291):揭开沃森超级电脑的神秘面纱
- 问题输入(QUESTION IN)
- 问题分析 (Question Analysis)
这个问题什么意思?
我们在找什么?
还存在其他有效信息么?
问题中有没有词语提到问题中的其他词语?
在这一环节,IBM的DeepQA软件自动尝试去理解这个问题,搞清楚问题到底在问什么,同时做一些初步的分析来确定选择哪种方法来应对这个问题。
- 初步搜索 (Primary Search)
在数据库中能不能找到或许跟这个问题有关的文件?
找到了多少文件?
这些文件从哪里来的?
- 搜索结果处理并生成备选答案 (Search Result Processing and Candidate Answer Generation)
在这些文件中,有这个问题可能的答案么?
有多少个备选答案?
-
上下文无关回答得分 (Context-Independent Answer Scoring)
这个选择有可能是正确的答案吗?
这个选择是正确的答案形式吗?
-
软滤波(
Soft Filtering )
有哪些选择是明显错误的?
如果是的话,能不能让它们在后面的处理过程中不占太多的时间?
-
支持证据检索( Supporting Evidence Retrieval)
能在数据库中找到任何能够证明某个选择答案是正确的信息吗?
对每个选择来说有多少信息在哪?
- 搜索结果处理和上下文相关得分 (Search Result Processing and Context Dependent Scoring)
选择工作作为问题回答怎么样?
现在有更多的信息,能给每个选择什么分数?
- 最终合并并排名(Final Merging and Ranking)
每个选择的总分是多少?
哪个选择分数最高?
分数第二高的选择是什么?
还有任何能够改变分数的额外信息吗?
DeepQA也观察到了这种现象:不同的表面形式通常会被不同的证据支持,并得到完全不同但潜在互补的分数,这产生了一种方法:将答案分数在排名和信心计算之前先合并掉。
-
输出答案 (ANSWER OUT)
有用的最高分答案被返回,然后沃森尝试判断从它做的多好(或者多坏)中进行学习。
由此可见,Waltson的工作原理就是“实事求是”,不是耍嘴皮子。
袁以