冯志伟|《知识图谱:认知智能理论与实战》序言,转载自西去东来中传站

标签:
冯志伟人工智能术语学语言学知识图谱 |
冯志伟 | 《知识图谱:认知智能理论与实战》序言
点击蓝字关注我们https://mmbiz.qpic.cn/mmbiz_png/pqsyiaeAnesQEXMtcXPicyeJMtxQ3BM96Sk8hL7poF0ib1PH1bEHUEdzuias29hkQK93icydiaALsBTaqyN9wxHNRQFw/640?wx_fmt=png
《知识图谱:认知智能理论与实战》序言
王文广的《知识图谱:认知智能理论与实战》一书,深入浅出地介绍了知识图谱的知识,并且指出:知识图谱是人工智能发展的阶梯。人工智能的目的在于处理知识,人工智能有了知识图谱这种形式化的知识表示方式作为阶梯,当然会取得蒸蒸日上的进步。我同意王文广的这个观点。
https://mmbiz.qpic.cn/mmbiz_jpg/pqsyiaeAnesQEXMtcXPicyeJMtxQ3BM96S3qeCLFhevIUBQbL0s7q5icCoIggeZpBlb78Yyt6fpJGbJIuxjb6vHGQ/640?wx_fmt=jpeg
早在1956年美国的达特茅斯学院召开的达特茅斯会议上,学者们就提出了“人工智能”的设想,此后,人工智能迅速地发展起来。自然语言处理是人工智能的重要研究领域,在自然语言处理的研究中,学者们开始构建自动推理模型进行问题求解,提出了语义网络、框架、脚本等一系列知识描述的理论和方法。
Sowa(索瓦)等人在1983年提出了“概念网络”来进行知识描述。学者们根据符号主义的原则,将实体之间的关系局限于“拥有、导致、属于”等特殊的基本关系,并定义了一些在图谱上推理的规则,希望通过逻辑推理的方式实现人工智能。
在这些知识描述理论和方法的基础上,领域专家开始使用人工的方式,编写实例数据,建立知识库,这些研究在一些受限的领域获得成功。学者们开始关注知识资源的研究。
互联网出现之后,人们在与自然和社会的交互中,创造了大规模的数据,人类社会进入了大数据时代,这些大数据以文字、图片、音频、视频等不同的模态存在,怎样让计算机自动识别、阅读、分析、理解这些庞杂而海量的大数据,从中挖掘出有价值的信息,为用户提供精准的信息服务,成为了下一代信息服务的核心目标之一。
2001年,Tim Berners Lee (蒂姆•贝讷尔斯•李)提出了语义网的概念 ,定义了一种描述客观世界的概念化规范,通过一套统一的元数据,对互联网的内容进行详细的语义标注,从而给互联网赋予语义,把网页互联的万维网(WWW)转化为内容互联的语义网。在语义网思想的影响下,亿万网民协同构建了“维基百科”(Wikipedia),促进了知识资源的迅速增长,在知识类型、覆盖范围和数据规模上都达到了空前的水平。
1972年的文献中就出现了“知识图谱”(knowledge graph)这个术语。2012年5月,谷歌公司(Google)明确地提出了知识图谱的概念并构建了一个大规模的知识图谱,开启了知识图谱研究之先河。从此,知识图谱便在自然语言处理的研究中普及开来,成为自然语言处理研究的一个重要内容。
https://mmbiz.qpic.cn/mmbiz_jpg/pqsyiaeAnesQEXMtcXPicyeJMtxQ3BM96SWa1mKKXc0LD4V4TbibjK93adcBNkW43IGjBEz3G52IlMBiaiaeOibXWWow/640?wx_fmt=jpeg
(图片来自网络)
知识图谱用结点(vertex)表示语义符号,用边(edge)表示符号与符号之间的语义关系,因而构成了一种通用的语义知识形式化描述框架。在计算机中,结点和边这样的符号都可以通过“符号具化”(symbol grounding)的方式表征物理世界和认知世界中的对象,并作为不同个体对认知世界中信息和知识进行描述和交换的桥梁。知识图谱这种使用统一形式的知识描述框架便于知识的分享和学习,因而知识图谱受到了自然语言处理研究者的普遍欢迎。
https://mmbiz.qpic.cn/mmbiz_jpg/pqsyiaeAnesQEXMtcXPicyeJMtxQ3BM96SxmBWI15cL0f5fhx11Gvr8t7WAvNa0fdPTZeoiciaQ5qCZHokJ5f7Ric8A/640?wx_fmt=jpeg
自Google公司构建了知识图谱,并在2012年发布了包含507亿实体的大规模知识图谱 ,不少互联网公司很快跟进,纷纷构建了各自的知识图谱。例如,微软公司建立了Probase,百度公司建立了“知心”,搜狗公司建立了“知立方”。金融、医疗、司法、教育、出版等各个行业也纷纷建立了各自垂直领域的知识图谱,大大地提高了这些行业的智能化水平。Amazon(亚马逊)、eBay、IBM、LinkedIn、优步等公司相继发布了开发知识图谱的公告。与此同时,学术界也开始研究构建知识图谱的理论和方法,越来越多的科学文献发表关于知识图谱主题的文献,其中包括书籍、论文、新技术,以及有关知识图谱的调查。知识图谱得到了产业界和学术界的认可和关注。
知识图谱技术的发展是有很深的历史渊源的,它源于人工智能中自然语言的语义知识表示的研究,并经历了互联网信息服务不断深化需求的洗礼,现在已经发展成为互联网知识服务的核心工具了。
以语义网络(semantic network)为代表的知识表示的理论研究,互联网智能化信息处理的应用实践,以维基百科(Wikipedia)为代表的网络协同构建知识资源的创举,这些因素的总和推动了知识图谱的进一步发展。
目前,大规模的知识图谱有
Wikipedia、
DBpedia,
YAGO,
Freebase,
Wikidata,
NELL,
Knowledge Vault等。
这些大规模的知识图谱用丰富的语义表示能力和灵活的结构来描述认知世界和物理世界中的信息和知识,成为了知识的有效载体。
《知识图谱:认知智能理论与实战》一书系统全面地介绍了知识图谱的核心技术,既有宏观整体的技术体系介绍,也深入关键技术和算法细节,适合于作为高等学校的“人工智能”课程的参考,也可以作为产业界作为系统开发的指南。
冯志伟https://mmbiz.qpic.cn/mmbiz_png/pqsyiaeAnesQEXMtcXPicyeJMtxQ3BM96SibuX5Rk6hic08Zq8cPlcXVfemfibE2LUibYr3hDrxwicHagt7NaQCkuvO2A/640?wx_fmt=png
中国中文信息学会会士
中国计算机学会 NLPCC杰出贡献奖获得者
2022年2月10日
前一篇:以开放心态推动元宇宙发展
后一篇:冯志伟先生的语言探秘之旅