加载中…
个人资料
郭昂9
郭昂9
  • 博客等级:
  • 博客积分:0
  • 博客访问:168,014
  • 关注人气:330
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
正文 字体大小:

在微软的日子(二) 想为又无为的第二年

(2012-03-31 09:53:34)
标签:

杂谈

分类: 工作随感

    CHEv2上线成功后,整个项目进入了休整期,不知道是否会有下一个版本。而这段时间,是我相对而言非常轻松的时间,同时自己因为准备结婚,同时又在忙于装修房子,也是在家庭上非常忙的时间。

   这时候,由于其他人项目调动,我接手了一个叫做SCD的项目,主要是进行敏感信息检测。我很快发现了这算法存在的一些问题,在特征选择中有重大缺陷,会使某些特征直接决定最终结果。同时在线上数据的效果很差,与客观评测形成巨大差异。我向经理提出自己能把这个效果提升很多,但Li告诉我,我是RSDE,算法上的修改需要美国的Research主持才能进行,否则即使我改好了,也无法被信任。

    当时十几个人还自发成立了一个兴趣小组,目的是学习及修改,使得微软的广告发布系统能够支持中文,自己因为没什么事情自告奋勇当了某个组的组长,当时学习了完整的代码并进行debug,当最终大家进行整合使得成功在微软的中文搜索结果中出现广告时,心理异常兴奋。

    在中间大概4个月中,回想起来,我实在记不起自己除了为CHE做支持并且做了算法调试系统还做了啥事情。此后,微软Adcenter和Window Live China合并,成为一个新部门Ad Platform China(APC),搬到了清华科技园。Weibin调过来做了我们的leader,负责主持算法团队。后来我提出过优化整个数据存储系统和流程,提出过建立一个通用性可定制性的分类体系框架。但是都是在计划中就因为CHEv3被叫停了。

    CHEv3的启动,是因为美国那边新来的一个很强的Taxonomist(分类学家)Karthik,她提出了CHEv2在结构上的大量缺陷,并提出并驱动了这个项目。CHEv3修正了从原有版本分类学上以及训练数据上的很多重大问题,整体合理性大幅提升。然而,因为涉及到目录树的变化,客户(公司内的其他组)不愿意去做这个更改,还有其他诸多原因,最后整个项目被废掉,Karthik也相继离开公司。

    在这个工程中,我开发了一个强大的分类分析平台,为整个分类体系的整体效果分析、类目交叉分析、Case分析、版本比较等提供了完备的解决方案。同时还带了一个实习生,他作为一个即将大四的学生,在两个月内轻轻松松做出了让很多正式员工不敢相信的成绩,当他离开哪天,我知道在他们实习生屋子里白板上写着的“Mentor真是太好了”是他所为,心理充满的无限的激动和感动。

    这时,离CHEv2的发布刚好一年。一套debug系统,一个分析平台,一个兴趣小组的demo,一次失败的版本,一腔期望能证明自己的抱负,是我这一年的所有收获。

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
前一篇:随感
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

    < 前一篇随感
      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有