加载中…
个人资料
对外汉语教师
对外汉语教师
  • 博客等级:
  • 博客积分:0
  • 博客访问:1,033,910
  • 关注人气:4,119
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

许嘉璐与网络安全

(2009-06-22 11:39:46)
标签:

许嘉璐

绿坝

概念层次网络

网络安全

文化

分类: 新闻时评

  

 网络是把“双刃剑”。

  在网络融合、通信技术飞速发展的信息时代,除了病毒、黑客攻击,信息安全的范畴至少已经扩展到了通信干扰、窃取,信号阻断、置换,传输网络切断,隐私泄漏等更为复杂和宽广的层面。其中制黄贩黄、宣扬暴力、低俗的网上传播一度甚嚣尘上,严重影响着青少年的身心健康和社会稳定。截至2009年4月中旬,我国已经关闭了3000多个低俗网站。

  “我们的信息安全正在受到威胁。是不是仅仅依靠关闭网站就能一劳永逸?这如同大禹治水,仅仅靠‘堵’可能很难达到预期目的。最好的办法,除了强化法制、提高免疫力,还要有技术干预,而这种技术是可以实现的。”讲这番话的不是别人,正是一直关注我国信息安全问题的著名语言学家、原全国人大常委会副委员长许嘉璐。

联手:信息高速路上共谋安全

  时光回溯到上世纪90年代初。

  “日读一卷书”书屋。许嘉璐坐在写字台前,悄然合上尼葛洛庞帝的《数字化生存》最后一页。望着窗外阑珊灯火,他思绪万千,强烈地感受到数字化带来的挑战,信息高速公路上时刻存在安全隐患,可能危及国家安全、社会稳定和国民经济发展的大局。

  这不是杞人忧天。2000年9月,第55届联合国大会发出十点倡议,号召全世界联合起来,共同防范网络犯罪。美国也在APEC会议上发出共同打击网络犯罪活动的倡议,呼吁世界各国从法律和技术两个层面加强网络安全防范,加大对网络安全犯罪和网络恐怖活动的打击力度。与此同时,人们看到,搜索引擎已经成为信息安全的重要目标之一,个别搜索引擎披露了一些国家的地理地域、军事设施和经济资源信息,引起世界各国的高度警觉。

  许嘉璐表示:“信息安全关系到国家根本利益,是国家安全的重要组成部分。这不只是学术界的‘热门话题’,更是值得全社会关注的重要现实问题。为了国家的安全,我们要有自己的计算机语言处理方式。”

  这时,许嘉璐担任着国家语委主任。作为训诂学家,他对古代汉语、现代汉语深有研究,此时又开始关注计算机语言处理。在他的主持提议下,国家语委设立了一个专业部门,负责管理和研究计算机语言处理工作。按照西方计算机语言理论操作进行的研究,始终未能跳出基于“理性”、“规则”、“关键词”窠臼,三四年后发现此路不通。许嘉璐为此食不甘味,夜不能寐。

  许嘉璐有一位老友叫黄曾阳,在中国科学院声学所工作,黄曾阳创立了一种立足于汉语特色的信息处理理论。黄曾阳的父亲是一位著名训诂学家。潜移默化的影响,使得黄曾阳古文古诗词功底非常深厚。上世纪五十年代“向科学大进军”的号召,促使黄曾阳进入北京大学物理系理论物理专业,1958年毕业后,来到中国科学院声学研究所工作。1988年以前的30年间,他主要从事信号处理和水声物理方面的研究,1989年以后,转向自然语言理解领域,由“听”水声改为“听”人声。由于兼有中国传统语言学、信号处理、哲学等方面的造诣,经8年卧薪尝胆,黄曾阳创立了计算机自然语言理解处理的“概念层次网络理论”,简称HNC理论。

  HNC理论摈弃传统方法,力图引导计算机模拟人类大脑对语言的感知模式去理解自然语言,借鉴吸收中国古人对语言理解的成果,在语言的语义层面上构建了概念的层次网络,并提出一种描述语句深层语义结构的简明语句分类序列和表示式,建立了可由计算机接受和操作的公式和分析模式,以使计算机具有理解自然语言的智能——这是几十年来未能攻克的世界性重大科学难题。

  1995年10月,北京正是霜染红叶的季节,中国科学院“香山会议”的一次主题会在香山饭店举行,研讨“跨世纪中文信息处理技术及其研究方向”,许嘉璐是这次会议的主讲人,会上,遇到老友黄曾阳,了解到黄曾阳正在进行的研究课题时,大有联手恨晚的感觉。许嘉璐将HNC理论列为我国中文信息处理三大流派之一,并对其发展寄予厚望。他不仅对黄曾阳的研究提供思想上的支持,还给予了研究经费上的帮助。

  鸿雁传书。许嘉璐与黄曾阳通过电邮传达各自的构想。后来,许嘉璐把自己的一些思路写成文章,收进文集。再后来,许嘉璐担任全国人大常委会副委员长,仍难以割舍研究计算机语言处理的情结。在视察HNC工作时,许嘉璐说:“这是落实科技兴国的一件实事。”许嘉璐亲自主持了国家计算机自然语言理解的“863”攻关项目。

  许嘉璐的得意门生、训诂学研究生陈小盟早年下海,在深圳从事研究与贸易,一路春风时,却意外地被导师召回北京。许嘉璐一脸严肃:“我想同你商量一件事。我们要有自己的计算机语言处理系统,这不仅是一项科研,重要的是关涉到信息安全与国家安全。把你的公司关掉,把这些年下海的赢利拿出来,注册一个IT公司,帮助黄先生把HNC基础理论研究搞起来。”

  陈小盟知道,西方语言学理论中有乔姆斯基的语言深层结构理论、奎廉的语义网络理论、山克的概念从属理论、菲尔墨的格语法,而中文的计算机语言信息处理与这些理论不尽相同,要有“字义基元化,词义组合化”的汉语研究背景,要有音韵学、训诂学和汉语语法研究及传统计算机语言学研究背景,才有可能胜任。而这几点,正是他的长处。2000年底,陈小盟毅然辞去北京麦纳科技公司总裁职务,带着1000万元投资,闯进中关村,与中科院声学所合作注册成立了北京大正语言知识处理研究院,黄曾阳受聘担任研究院的首席科学家。

  一项关系到国家信息安全的自主创新事业,序幕徐徐拉开。

要素重组:让自主创新能力无穷大的秘密

http://www.gmw.cn/images/2009-05/17/xin_570506170955546775118.jpg

  许嘉璐(右)和他的学生陈小盟(左)。中为河北省委常委、唐山市委书记赵勇(时任团中央书记处书记

)。

  许嘉璐曾经撰文指出,HNC的研究,第一,必须采取集体攻关的办法;第二,可以用“百花齐放,百家争鸣”的方针,不拘一格,几种风格齐头并进,既相互竞争,又彼此取长补短;第三,采用科学的管理办法,按照科学研究的规律管理;第四,既要争取国家的支持,又要尽量与企业合作;第五,既要出成果又要出人才;第六,中文信息处理事业将是长期的,要有薪火相传的准备;第七,允许失败,在不断失败—研究—再失败—再研究的循环往复中前进。

  按照这一思路,北京大正语言知识处理研究院十分注意生产要素重组工作,他们要让自主创新的能力无穷大。

  在许嘉璐的主持建议下,2004年1月,北京师范大学成立了中文信息处理研究所,以发挥语言学与应用语言学学科优势,加强中文信息处理应用基础研究;促进语言学与计算机等相关学科的交融,推动计算机语言学这一交叉学科的发展;搭建中文信息处理领域的合作平台,汇集高校、科研院所、高科技企业的专家学者集体攻关,探索中文信息处理理论与应用研究的新路;为国家培养兼通语言学与计算机科学的“两栖型”专业人才;保持我国在语言信息技术领域的竞争力,保障国家、民族和社会的信息安全。

  而北京大正语言知识处理科技有限公司,具有民营性质,是针对自然语言理解处理的理论探索及其技术应用的高新技术企业,是科技成果转化的基地。

  根据许嘉璐的意见,研究院第二个资源重组的表现为全新的“学、研、产、用”相结合的产业化创新之路。许嘉璐多次指出,中文信息处理事业事关国家安全和社会稳定,它的发展需要加强基础研究、应用研究和社会需求三者的结合,需要语言学界和计算机科学界专家学者的密切配合、共同攻关。HNC基础理论和技术及其应用研究过程中,课题组通过探索市场经济条件下的科学研究模式和项目管理模式,组织了中国科学院、北京大学、清华大学、上海交通大学、北京大正语言知识处理研究院等高校、科研院所、高科技企业的专家集体攻关,打通语言学与计算机科学的壁垒。

  中国计算机语言学专业委员会第一届主任鲁川,在《有关“科学”和“语言”的畅想》一文中写道:“HNC是自然科学跟人文科学交叉的新兴‘智慧科学’的一个典型代表。在探索过程中,北京大正语言知识处理研究院根据社会生产需求拓展研究领域,以理论研究促进方法学的创新。以应用方法学创新,催生应用成果的实现,用应用成果转化反哺基础研究,使自主创新逐步走上了良性循环的道路。”

持续创新:“核心竞争力”的金钥匙

http://www.gmw.cn/images/2009-05/17/xin_5705061709559843045719.jpg

许嘉璐(前右)与陈小盟(后左)在工作中。

  在强手如林的竞争中,北京大正语言

知识处理研究院招兵买马,广纳贤才,依托黄曾阳的HNC理论,在许嘉璐的精心指点下,潜下心来,埋头HNC基础理论研究和各项实验,一干就是8年。这8年,得到了慧眼识珠的中关村管委会和北京市委、市政府的大力支持。

  八度燕来雁去,八度星回岁改,八度寒来暑住,八度春华秋实。

  8年前,黄曾阳的理论还只是一些公式和PC机上的初步模版演示。8年后,他已经是诗情画意,收获满囊。他的专著《HNC(概念层次网络)理论∶计算机理解语言研究的新思路》由清华大学出版社出版,概念层次网络的研究,对语义文本、分词等等的研究渐入佳境。黄曾阳也桃李满枝,不少学子志愿投身到HNC理论这一具有自主知识产权的研究中,并不断寻求新的创新与突破。

  8年中,研究院一步一个脚印,捷报频传:

  2001年6月,研究院成立半年后,HNC网络信息智能过滤器样板机诞生并进入中试。年底,过滤器开始试应用。它能有效地识别文本信息内容,提高了智能与自动识别能力,对网络中流动的海量电子文本信息进行目标搜索与追踪。这一成果,使我国在信息语言知识处理领域的国际竞争中占据领先地位。

  2003年4月,“HNC信息智能过滤器”以其卓越的品质通过公安部计算机信息系统安全产品质量检测,5月,取得公安部颁发的《计算机信息系统安全产品销售许可证》,6月,取得国家版权局颁发的软件著作权登记证书。

  2004年,“HNC信息智能过滤器”获得北京市科委颁发的软件企业认定和软件产品登记认定。

  2005年,研究院参与承担的“中文信息处理应用基础研究”课题,顺利通过国家高新技术研究发展计划(863计划)验收,HNC开始形成了具有原始创新特点的理论与技术体系。

  2007年,研究院承担了国家科技支撑计划“中文信息处理应用研究与系统开发”课题的研发。

  2008年5月,工业和信息化部公布:大正研究院的“花季护航”上网管理软件,中标“绿色上网过滤软件产品一年使用权及相关服务采购”项目,成为国内相关领域软件产品中惟一入选文字过滤产品……

  8年来,大正研究院和北京师范大学中文信息处理研究所一起,先后承担了包括国家重点科技支撑中文信息处理应用研究与系统开发项目(即原国家973计划项目)、国家863计划项目及中科院知识创新工程项目等科研任务。

  8年来,大正研究院在国内外学术期刊发表论文60余篇,取得了2项发明专利、17项计算机软件著作权。

  总结8年的创新实践之路,研究院董事长陈小盟感慨良多。

  陈小盟说:“思想与理念有多远,创新之路就会有多远。在大正研究院,我们提炼了这样一条理念:HNC语言知识处理基地是一株大树;HNC语言知识、HNC概念联想网络、以此为基础吸收进来的其他理论应用成果、世界知识是它的根;建立在对语言的语义理解的基础上,应用在计算机对语言信息的智能化处理的多个层面是它的果实。”

  按照许嘉璐的构想,研究院更像一个孵化器,在特殊机制催生下,HNC理论好比种子,市场需求好比土壤,北京大正语言知识处理研究院的基础理论研究好比耕耘,而实用技术和项目则是阳光雨露下破壳而出的新生命。

  党的十七大以后,他们认真学习科学发展观,对自主创新开始了新一轮的反思。经过总结经验教训,逐步达成共识:研究院的核心竞争力,来自持续不断的自主创新;自主创新的动力来自市场需求。自主创新是一个科技、经济一体化过程,是技术进步与应用创新共同作用催生的产物,从而对知识社会条件下以需求为导向、以人为本的创新模式更加坚定不移。

八年“潜伏”:赢得“红杏枝头春意闹”

http://www.gmw.cn/images/2009-05/17/xin_580506170955421710220.jpg

黄曾阳(中)在一次机器翻译研讨会上。

  黑格尔说过:“要是没有热情,世界

上任何伟大事业都不会成功。”

  作为HNC基础研究课题的重要承担单位之一和成果转化基地,大正语言知识处理研究院、大正语言知识处理科技有限公司汇集了一大批莘莘学子。他们甘于奉献,耐得住寂寞。许嘉璐说:“在IT界员工的收入一般是可观的,而且跳槽早已司空见惯,‘大正’的收入只能说是中等水准,但到这里工作的学子们很少抱怨。大家默默耕耘,无私奉献,就是为了让具有自主创新的技术能够茁壮成长,就是为了提高国家的科技软实力。”

  自主创新激发出蓬蓬勃勃的活力,HNC基础理论研究犹如一株青翠欲滴的新苗,一旦破土而出,就呈现出日新月异的景象。自主创新不断推动着科研成果的产业化进程,随着基础理论研究的深化,“大正”的系列产品脱颖而出。

  在推出HNC信息智能过滤器后,研究院又针对家庭、学校、网吧、企事业单位等不同用户群推出系列产品,形成丰富的产品线。值得称道的“花季护航”上网管理软件,刚刚出炉就炙手可热,被全国妇联“百万家庭护苗工程”确定为指定产品。“花季护航”上网管理软件,运用特有的语义判定技术,能够自动判定识别信息的褒贬义,对黄色暴力黑色等不良信息进行有效的防止与过滤。海量内容审查和管理系统——自动审查软件,是针对海量内容难于搜索、难于管理,人工审核费时费力等问题而开发的一款自动审查出版内容的软件,让计算机模拟人脑,在“理解”的基础上判断文本内容,有效地解决了误审核的问题,提高了审核的准确度。

  与此同时,北京大正语言知识处理研究院还面对汉语加快走向世界的客观需求,开发推出了创新、实用、大众化的“汉语之声”网站,用户可以在汉语之声网站享受学习汉语、体验中国文化、订购中国文化产品等专业服务。

  面对果实累累的今天,许嘉璐说:“自主创新是实现民族复兴的不竭动力,中华民族要自立于世界民族之林,要展翅腾飞,就要不断提升科技软实力,依靠自主创新变中国制造为中国创造。要在自主创新中出成果、出人才。北京大正语言知识处理研究院开发HNC基础理论技术,并通过自主创新取得了初步成果,这仅仅是一个尝试。相信我们国家会有大批类似HNC这样的自主知识产权理论和技术诞生,也相信会有大批北京大正语言知识处理研究院式的IT企业脱颖而出。”  


 2009-05-17 09:55 来源:光明日报

http://www.gmw.cn/01gmrb/2009-05/17/content_921974.htm


 

 

1 2 3

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有