加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

讲诉微博寻人的背后

(2012-04-24 19:37:40)
标签:

杂谈

    小的时候,我特别渴望能有一个变型金刚,父亲就给我买了一个,18元,那时是1987年。
    这个变型金刚是一个组合机器人的一条腿,虽然我梦想能得到另外的4个,但这不现实,我也再没有和父母提及。
    工作后,我拿着工资,买齐了这个组合体,实现了梦想,梦想很简单,得到了很满足。这是2007年的事情。
    长大了以后,梦想变得不那么具体,但依然简单。
    硕士毕业,我进入了搜索行业,这个行业竞争很激烈,我边学边做,我想如果每个入门的人都能有一本简单易读的入门书就好了,于是我就花时间写了一本,这本书叫《走进搜索引擎》,那一年是2008年。
    书籍出版的时候,当看到读者的感谢时,我获得了一种受到尊重的感觉,这种感觉让人中毒。
    读了博士以后,回顾我当初在学校做个性化的工作,做用户日志系统,缺乏一个足够有威力的DB,于是我想尝试做一个,想明白以后就去做了,这个东西叫THUIRDB,那一年是2011年。
    THUIRDB有很多单位申请体验,但没有一家真正的用起来。
    后来,我学习了机器学习,学习了一些深刻的算法,我觉得可以和THUIRDB组合起来,微博是很有趣的工作对象,我想到了做寻人系统,这是2011年下半年的事情,我快速做了一个原型系统,检索一次速度很慢,给个别朋友和老师看过。
    2012年,我觉得可以将它做成一个在线系统,我给自己2周的时间,去年的代码能拿过来的只有不到100行的排序算法。其余的数据做库,前台,后台服务都需要自己完成,服务器配置等等。正当我要做好的时候,父亲病了,在医院陪伴父亲4周后,我快速的回到工作岗位,开始做推上线的工作。
    做界面,加统计代码,各种工作,在今天,把它推上线了,到现在这个服务已经有1万PV了,1600多UV。
    微博寻人主要算法很简单,标签+个人简介中提取关键词,关键词做倒排,内容是用户ID,倒排表按照影响力排序,影响力用类似PageRank算法实现。难点是做到在线系统,快速的给出结果,整个服务背后只有一台服务器做支撑,我给自己的要求是顶住不垮掉就算完成任务了。到目前为止表现很好。
    父亲得癌症以后,我愈发觉得时间的宝贵,要利用有限的时间,做更多更有意义的工作,我的梦想很简单,我的快乐在于我走在实现梦想的道路上,从来也不曾放弃过。

    微博寻人网址,请点击:http://xunren.thuir.org/
    讲诉微博寻人的背后

    

  
 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有