师傅指着一片林子说:“林中有鹿”。
第一个徒弟很信任自己的师傅,二话不说,钻进了树林,树林里兔子、野鸡不少,他都视而不见,细心地搜索着鹿的踪迹,功夫不负有心人,末了还真扛着一头鹿走了出来。师傅大喜,师徒一起烤鹿肉吃,香飘十里。
第二个徒弟站在树林外,一圈一圈地转悠,就是不进去,他想:“真有鹿吗?老师也多年不亲自打猎了,如果没有鹿,反而遇见狼咋办?即便真有鹿,这么大的林子,我能找到吗?真找到了,就凭我的枪法,能打中吗?就算打中了,一头鹿到底有什么价值呢?”时间一分一秒地过去,日薄西山,徒弟空手而归。
1995年,我开始攻读博士学位,导师帮我选择的博士课题是自动文摘,他说尽管目前自动文摘还没有被应用,但是等到将来网络上的信息太多了,就会用起来了。14年过去了,互联网上的信息极大丰富,简直泛滥得要把人们淹没,但自动文摘仍然没有被应用。现如今,搜索结果页面中每个超链接下方都有2-3行文字,这些文字是原文中包含了查询词的一些不成句的片段,英文叫“snippet
最近“实时搜索”的概念受到业内关注,我没有什么调研,凭感觉谈了几个观点:
1、目前的搜索结果是按照相关性和重要性进行排序的,而忽视了时间维,关于某个话题的最新消息往往不能在网页搜索中优先显示出来。新闻搜索、博客搜索考虑了时间维,但做不到实时,酷讯的火车票搜索是实时搜索的一个典型案例。实时搜索的需求客观存在。
2、如果“实时”定义为“几秒内”,则实时搜索的需求又是有限的,大多数搜索不需要时间信息,需要时间信息的又不一定需要实时,可能按照时间顺序排一下就行了,而不需要那么快的更新,比如爱搜车上的“众评”。
3、要做全网的实时搜索是极其困难的,因为爬虫的速度达不到那么快,区分一个被爬的网站中哪些页面是刚刚更新的也不容易。全网的实时搜索也是没有必要的,因为绝大多数网站更新都很慢。
4、最有价值,也是最容易做的实时搜索就是跟Twitter这样的即时博客相关联,Twitter自己非常清楚Twitter内的哪些信息是刚刚更新的,不需要爬取和时间性判别。Twitter本身就是即时信息的具有垄断地位的集散地,能跟他竞争的即时博客很少,搜索没有必要在多个即
2009年8月18日,我作为嘉宾出席了百度技术创新大会,现场聆听了李彦宏关于“框计算”的报告,颇有感触,略述如下。
近年来在IT业界,总是听到跨国公司提出的新概念,我们的政府、企业界、学术界虚心学习,比如“电子商务”、“可信计算”、“网格计算”、“云计算”,直到“智慧地球”。今天,终于听到了来自本土企业的声音“框计算(Box Computing)”。无论框计算是不是新瓶装旧酒,无论它有没有足够的生命力,在50多米宽令人眩目的超大型展示屏前,在中国大饭店2000多人的豪华会场上,一位本土企业的总裁向世人提出一个高度凝炼的新概念,用自己的“框计算”对抗跨国公司的“云计算”,在理念上舆论上争夺技术战略主导权,并且在极短的时间内就通过媒体对IT业界产生强烈的震撼,这个事件本身就有足够的里程碑意义。
其实,“框计算”和“云计算”是各执一端,并无对错可言。“框计算”强调的是前台,“云计算”强调的是后台,但由于“云计算”在后台,终端用户的体验并不明显,而“框计算”是人机交互的界面,搜索“框”用户每天都在用,因此“框计算”更容易理解,更容易被广大的普通用户所接受,在宣传上百度的这次策划是
杜甫诗云:“江流石不转,遗恨失吞吴”。那么,刘备进攻江东,打破吴蜀联盟,到底是不是犯了战略错误呢。《三国演义》中写刘备义气深重,定要为关张报仇,更一意孤行,不听孔明、赵云的苦劝。对此,我一直有不同的看法。
刘备是战略家,他说“操以急,吾以宽;操以暴,吾以仁;操以谲,吾以忠;每与操相反,事乃可成耳。”刘备的宽、仁、忠不仅仅是个性使然,更主要的是战略选择。在尔虞我诈的群雄中,刘备树立了自己清新的政治家形象。宽仁的形象下,目标还是争天下,刘备起步时虽然弱小,但从不放弃每一次争雄的机会。在新野时,孔明劝刘备趁刘表病重而取荆州,刘备说不忍夺同宗基业。其实这都是条件不够成熟时的一种托词,拿不到,就说自己不拿,进一步美化自己的形象。隆中对时刘备就下了夺取益州的决心,后来的事实也证明他对于夺取刘璋这
一年一度,评职称的日子又到了,十几个人参评正教授,名额只有两个,大家的材料都不错,你有把握胜出吗?跟某企业谈合作,接待企业参观,介绍实验室的成果,讨论项目方案和报价,会谈十分融洽,但几个月过后,没有任何结果,催问一下吧,该企业答复,他们正在多家研究机构之间进行比较。在海外漂泊多年,想回国了,但是回到国内能找到合适的位置吗?已经习惯了国外的生活,回国后自己和家人能够适应吗?
为考研复习了一整年,但在考场上发挥得一般,成绩按说应该出来了,怎么还不公布呢,简直是度日如年。一篇学术论文投出去,三五个月了,还不见回音,到底能不能被录用?参加了好几家公司的笔试面试,等啊盼啊,始终没收到一张接收函。博士读了四年了,发表的论文还没有达到学院的要求,咋办呢,还能毕业了吗?会不会拿不到毕业证呢?处了两年多的女朋友,最近忽然开始对自己冷谈了,明天她会提出分手吗?
不确定,越来越多的不确定,沉甸甸地,压在人的心口,让人感到不安全,感到生活和命运不在自己的掌控之中。不确定,有的是我们自己犹豫不决、患得
2009年5月9日,实验室组织去哈尔滨动物园春游,在猛禽馆外伫立着一块巨石,上面刻着一段文字,题为“鹰的再生”,全文如下:
“鹰是世界上寿命最长的鸟类,一生的年龄可达70岁。可是很少有人知道,要活这么长的寿命,在其生命的中期必须做出艰难却重要的决定。因为鹰活到40岁的时候,它的爪子开始老化,无法有效地抓住猎物;它的喙变得又长又弯,翅膀也越加沉重,飞翔十分吃力。这时,它只有两种选择:一是等待死亡;二是重整后再生。选择重整后再生的鹰,要经过一个痛苦更新的过程。它首先要努力地飞到山顶,在悬崖筑巢,在那里渡过漫长而又痛苦的150天。这段时间,要用力将又长又弯的喙击打岩石,直到完全脱落,然后等候新的喙长出来;再用长出的新喙将指甲一根一根地拔出来;新指甲长出来后,再将羽毛一片一片地拔掉。待新的羽毛长出后,鹰又可以翱翔于广阔的天空,续走后30年的生命旅程。”
这段话在多数游客看来或许只是一篇科普介绍,但在我看来,这分明是一段关于人生的哲理散文,上帝借“鹰的再生”向中年人提出了一个严峻的命题:随波逐流,平庸到死,还是浴
下午犯困,不知不觉睡着了,朦胧中做两个梦:
一会儿梦见自己开着伊斯特伍德在《廊桥遗梦》里开的那辆破敞篷吉普车在中国西部的沙漠里穿行,沙漠里没有路,更没有红绿灯,油门踩到底,开向天边暮色中那一轮红日。平日里循规蹈矩的我此时留着阿根廷球星巴蒂斯图塔式的长发,左手食指和中指之间掐着一缕青烟。没有手机,没有GPS,没有拥挤的人群,也没有拥挤的思绪,就这样漫无目的地奔驰着。
一会儿我又成了一个侠客,对武学十分地痴迷,地点仿佛是黄老邪的桃花岛,抑或是叶问的佛山豪宅,书架上摆满了《九阴真经》《易筋经》《咏春拳》之类,兵器架上是倚天剑、屠龙刀、双截棍。没有师傅,对武学的探究保留着猜谜式的乐趣,每每心有所获,手舞足蹈,抚掌大笑。也没有弟子,偶有同道上门切磋,必仗剑亲出,展示平生所学,侠友谈笑间,只论武功,不知有江湖。
一觉醒来,发现自己趴在办公桌上,头发不但不长还有点卸顶,手机还在,又多了两条垃圾短信,掌中无剑,握着的是鼠标。书架上摆的是《自然语言处理》《信息检索》,电脑屏幕上有一行提示:“基金结题报告下周一务必提交”。窗外高楼林立,喧嚣依