加载中…

加载中...

正文 字体大小:

IBM Dr Watson 的那些事儿

(2015-09-20 13:59:58)
标签:

大数据

分类: 经济分析
任何依赖经验传承的行业,都需要足够的记忆力。就记忆力而言,长远来看,人脑一定比不过电脑。所以,从人类研究电脑伊始,尤其是开始研究人工智能以来,世界顶级研究机构,就致力于电脑医生的研制。

早期比较出名的研究项目,是斯坦福大学的 MYCIN [1],这套系统把医学临床指南,整理成 if-then 那样的规则,企图以此诊断疾病并下处方。if-then 式的规则库,又称为专家系统。MYCIN 共整理了 600 多条 if-then 式的规则。可惜,MYCIN 从未走出实验室投入临床应用。

在 MYCIN 的基础上,其它研究机构,添加了反绎推理等等,进一步完善推理机制,后来又添加了模糊数学,概率,贝叶斯模型等等,均不成功 [2]。 

就这样,从 1970 年到 2010 年,基于 if-then 式的演绎法及其变种,电脑医生的研究持续了 40 年,屡战屡败。人们开始反思,是不是应该换一个思路?2011年8月 IBM Dr Watson 登场了。

IBM Dr Watson 起初是一个研究项目,研究自动问答系统。例如,问:“谁是第一个登上印度次大陆的欧洲航海家?”。问答系统自动阅读大量文献,摘录出 “葡萄牙人,瓦斯科·达·伽马于1498年5月20日到达卡利卡特”。又从其它文献中,摘录出 “卡利卡特位于印度西南部”。串联这两条信息,得出 “葡萄牙人,瓦斯科·达·伽马,于1498年5月20日,登陆印度” 。同理,找到其他欧洲航海家登陆印度的时间。最后排序,从而找到问题的答案。

IBM 研究院从 2006 年开始研究自动问答系统,并参与美国智力竞答电视节目,Jeopardy!这个节目与江苏卫视的 “一站到底” 类似,主持人出题,竞答者比赛准确性和抢答速度。5 年以后,2011 年 2 月,IBM 的自动问答系统,战胜了往届人类冠军,一举夺魁。

半年后,2011 年 8 月,IBM 决定把自动问答系统,应用到医疗领域。

IBM <wbr>Dr <wbr>Watson <wbr>的那些事儿 
以上是 IBM 自动问答系统的工作流程 [3]。整个系统围绕三个核心构成,1. 自然语言处理,2. 基于循证的自动回答,3. 基于用户反馈的自学习和系统优化。其中,自然语言处理,和基于用户反馈的自学习和系统优化,大体上是常见技术。

这三个核心中,最有启发的是第二个,基于循证的自动回答。以往的电脑医生,基本原理都是专家系统,都是基于 if-then 式的规则,都是演绎法。而循证问答,基本原理是类比归纳法。通过类比大量相似病历,归纳出对应于某些症状,医生们通常习惯于做哪些检查。然后,类比相似检查结果,归纳出这些检查结果与哪些疾病关联密切。再然后,仍然基于相似病历的类比,归纳出对应于某一疾病或者某些疾病的组合,医生们通常习惯于开哪些药,等等。

从古希腊的帕拉图亚里士多德开始,人类的主要思想方法,是演绎法。到 17 世纪初,呐喊 “知识就是力量” 的培根,首倡归纳法。思想方法转变了,现代科学就萌芽了,随后就有了伽利略、牛顿、莱布尼兹等等科学巨匠。

循证学习依赖于海量病历。但是截止 2013 年 2 月,IBM Dr Watson 只收集到了 60 万份病历,此外还有 2 百万篇文章,2.5 万案例,1.5 万小时的门诊对话录音 [4]。远远达不到海量的数据规模。

怎么办?病历数量太少,做全科医生肯定不行。那就专门收集肿瘤专科的病历吧,全科医生做不了,那就先做专科医生吧。

为什么不惜工本的 IBM,花了那么多钱,只收集了那么一点病历呢?两个原因,1. 美国人口基数小,2. 美国隐私保护法执行太严。反观中国,一家中等规模的三甲医院,5 年积累的病历数量,就超过 1000 万份。所以,在中国做循证学习,比在美国更有机会。

今年 7 月份,IBM 与美国最大的连锁药店 CVS,签署合作协议,通过 CVS 的 7600 店铺和 1000 家诊所,监测 7 千万患者的健康状态,尤其关注糖尿病、高血压等慢性病 [5]。今年 8 月份,IBM 花费 10 亿美金,收购医疗图像分析公司 Merge Healthcare [6]

这两个举措,似乎表明 IBM Dr Watson 在发展规划上,内部有争议。与 CVS 合作,似乎意味着 IBM 计划尽快开拓市场,为患者服务。而收购图像分析公司 Merge Healthcare,似乎意味着 IBM 打算深入肿瘤、眼科、骨科、皮肤病等专科,最终完全取代人类医生诊疗在诊疗过程中的各个环节。

作为旁观者,更赞同与 CVS 合作,尽快开拓市场。而全面取代人类医生,即便仅限于某几个专科,将面临诸多艰难。但是与 CVS 合作,最好是全科,而不仅仅局限于专科。

沙特是全球石油储藏量最大的国家,中国是全球电子病历储藏量最大的国家。

如果中国也做 Dr Watson,很有希望超越 IBM 的版本。


参考文献:

[1] Introduction to MYCIN.
https://en.wikipedia.org/wiki/Mycin

[2] Introduction to Clinical Decision Support System.
https://en.wikipedia.org/wiki/Clinical_decision_support_system

[3] Introduction to IBM Dr Watson。
https://en.wikipedia.org/wiki/Watson_(computer)

[4] IBM Watson Progress and Roadmap,2013.
http://www.slideshare.net/manojsaxena2/ibm-watson-progress-and-roadmap-saxena

[5] IBM Watson and CVS deal.
https://www.washingtonpost.com/news/to-your-health/wp/2015/07/30/ibm-watson-cvs-deal-how-the-smartest-computer-on-earth-could-shake-up-health-care-for-70m-pharmacy-customers/

[6] IBM vs Merge HealthCare.
http://www.informationweek.com/healthcare/ibm-merge-healthcare-plans-giving-watson-the-gift-of-sight/d/d-id/1321668


联系方式:扫描微信二维码,或加微信号 deng_kan
IBM <wbr>Dr <wbr>Watson <wbr>的那些事儿 

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有