加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

无力感啊无力感……

(2011-02-05 05:37:38)
标签:

数据清洁

十项全能

数据挖掘

无力感

计算机

it

分类: 我不学术
最近遇见一姑娘,不知道哪儿人,看似中文说的都不太利索。一个学化学还是材料还是工程的女博士,记不清了。
姑娘问我,你是学什么的?
我说计算机。
姑娘问 第一年来英国么?
不是,去年也在这读硕士。
姑娘说硕士什么专业?
计算机。
问:那你本科在哪里?
北大。
问:你本科读的啥?
计算机。 
姑娘疑惑地看了我一会儿。说,都是计算机啊?
恩……

我着实不明白了。。对于计算机这个专业,本科硕士博士一直读 是哪里不正常了? 
难道我应该本科读个医学,硕士读个影视编导,博士再来读个计算机?
我是想多挑战我的人生啊……

再之后姑娘问我,你现在研究什么?
数据挖掘。
姑娘:具体做什么?
blabla简单地描述了一下我们现在的项目。最后总结就是在房地产领域内做数据挖掘。 
(其实我们做的是data extraction。但是我实在懒得解释data extraction 和 data mining. 想着数据挖掘这个词听说过的人还比较多就说这个。)
姑娘不屑地:那。。。你们用什么技术么?有什么难点么?
有什么难点……有什么难点……有什么难点……
(无力感再次爆发。。。。看见天上的云了么,我们以后要云计算。
 看见电脑了么,电脑就是人类发明,就是我们要用的技术。
 我觉得我应该说,恩,没难点,所以你来替我写程序把。很简单的哦!)

之前还遇到人问,YWY做神马的?
数据清洁。
那什么叫做数据清洁?
清洁脏数据的。
什么叫做脏数据?
譬如说一个公司有俩数据库,一个存每个人的工资信息,另一个存年龄家庭住址。 然后有一个员工过世了,年龄家庭住址里就删除了他。但是工资那边没删。 没删的那个就是脏数据了。
(我当时觉得我讲的真是通俗易懂啊)
人家又问了:那这有什么难的?
有什么难的……有什么难的……有什么难的……
我在想,我是不是应该跟他说,有一个叫图灵,家里养了一只小母鸡和一条无限长的带子。然后有一天小母鸡在这个带子上玩,生了几个蛋,摆了几个树枝,然后图灵一看说,哇塞牛啊!就受到启发了开创了图灵机。然后我就再说到停机问题不可判定最好再说一下停机问题的证明?然后再涉及到可判定性和时间复杂度? 这终于就难了吧。。有意思么。

最后我就觉得,隔行如隔山其实不可怕。可怕的是明明隔了山,还以为自己很牛掰……
我觉得学医的人可牛了,十项全能啊,人是一个多么复杂的东西他们能把人的病治好特别厉害。
我觉得学数学的人可牛了,十项全能啊,各种定理各种证明,那么复杂的数学公式人家都能搞清楚。
我觉得学中文的人可牛了,十项全能啊,阅读从古至今各种文章,文采飞扬。
等等等等…………
我觉得学计算机的可牛了,十项全能啊 杀的了木马翻的了围墙写的了代码查的了异常。

不管什么专业吧,我觉得人家在山那边读了那么多年书了…… 肯定比自己懂得多啊。。。 
然后我才发现,原来在人家眼里,我就在山那边乱蹦跶呢蹦跶的可欢儿了
------------------------------------------------------------------
最后,YWY原话什么是数据清洁。

你注册了一个超市的账号,譬如tesco。然后发现瓦擦,手机写错了。于是你重新注册了一个。旧的这个就是脏数据了。

你注册了一个tesco的账号。手机写错了你不知道。tesco给你发短信送优惠券的时候发现瓦擦,空号。这个就是脏数据。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有