无力感啊无力感……
(2011-02-05 05:37:38)
标签:
数据清洁十项全能数据挖掘无力感计算机it |
分类: 我不学术 |
最近遇见一姑娘,不知道哪儿人,看似中文说的都不太利索。一个学化学还是材料还是工程的女博士,记不清了。
看见电脑了么,电脑就是人类发明,就是我们要用的技术。
我觉得我应该说,恩,没难点,所以你来替我写程序把。很简单的哦!)
姑娘问我,你是学什么的?
我说计算机。
姑娘问 第一年来英国么?
不是,去年也在这读硕士。
姑娘说硕士什么专业?
计算机。
问:那你本科在哪里?
北大。
问:你本科读的啥?
计算机。
姑娘疑惑地看了我一会儿。说,都是计算机啊?
恩……
我着实不明白了。。对于计算机这个专业,本科硕士博士一直读 是哪里不正常了?
难道我应该本科读个医学,硕士读个影视编导,博士再来读个计算机?
我是想多挑战我的人生啊……
再之后姑娘问我,你现在研究什么?
数据挖掘。
姑娘:具体做什么?
blabla简单地描述了一下我们现在的项目。最后总结就是在房地产领域内做数据挖掘。
(其实我们做的是data extraction。但是我实在懒得解释data extraction 和 data
mining. 想着数据挖掘这个词听说过的人还比较多就说这个。)
姑娘不屑地:那。。。你们用什么技术么?有什么难点么?
有什么难点……有什么难点……有什么难点……
(无力感再次爆发。。。。看见天上的云了么,我们以后要云计算。
之前还遇到人问,YWY做神马的?
数据清洁。
那什么叫做数据清洁?
清洁脏数据的。
什么叫做脏数据?
譬如说一个公司有俩数据库,一个存每个人的工资信息,另一个存年龄家庭住址。
然后有一个员工过世了,年龄家庭住址里就删除了他。但是工资那边没删。 没删的那个就是脏数据了。
(我当时觉得我讲的真是通俗易懂啊)
人家又问了:那这有什么难的?
有什么难的……有什么难的……有什么难的……
我在想,我是不是应该跟他说,有一个叫图灵,家里养了一只小母鸡和一条无限长的带子。然后有一天小母鸡在这个带子上玩,生了几个蛋,摆了几个树枝,然后图灵一看说,哇塞牛啊!就受到启发了开创了图灵机。然后我就再说到停机问题不可判定最好再说一下停机问题的证明?然后再涉及到可判定性和时间复杂度?
这终于就难了吧。。有意思么。
最后我就觉得,隔行如隔山其实不可怕。可怕的是明明隔了山,还以为自己很牛掰……
我觉得学医的人可牛了,十项全能啊,人是一个多么复杂的东西他们能把人的病治好特别厉害。
我觉得学数学的人可牛了,十项全能啊,各种定理各种证明,那么复杂的数学公式人家都能搞清楚。
我觉得学中文的人可牛了,十项全能啊,阅读从古至今各种文章,文采飞扬。
等等等等…………
我觉得学计算机的可牛了,十项全能啊 杀的了木马翻的了围墙写的了代码查的了异常。
不管什么专业吧,我觉得人家在山那边读了那么多年书了……
肯定比自己懂得多啊。。。
然后我才发现,原来在人家眼里,我就在山那边乱蹦跶呢蹦跶的可欢儿了
------------------------------------------------------------------
最后,YWY原话什么是数据清洁。
你注册了一个超市的账号,譬如tesco。然后发现瓦擦,手机写错了。于是你重新注册了一个。旧的这个就是脏数据了。
你注册了一个tesco的账号。手机写错了你不知道。tesco给你发短信送优惠券的时候发现瓦擦,空号。这个就是脏数据。
前一篇:喵了个萝卜的新春大吉!
后一篇:一周流水账