加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

数据挖掘之“商业技术”

(2007-08-01 09:54:50)
标签:

数据挖掘

商业技术

数据处理

需求分析

bi

商业智能

分类: 数据分析
    最近我们团队来了一位新同事,刚从南方某大学毕业,原则上其实公司在二年前就声明不招收应届毕业生,但由于数据挖掘是一项很有特殊性的技术,抱着人材为先的原则,还是破格招了他进来。这位同事正在作进公司以来的第一次数据挖掘项目,我问,"数据建模的中什么最重要?",答曰,"数据处理和探索,就是看清数据,处理得当,建模才能事半功倍"。
 
    其实从建模过程来说,没有最重要的,如果非要说什么最重要,我希望是“商业技术”。也就是说,技术是为商业需求服务的,这是费话吧!那什么叫商业技术呢?泛指上说,就是基于商业实践的技术实施,数据挖掘是一项半自动化的商业数据分析行为,为什么“商业”在前面呢,就是这个道理,做BI和做分析的人员,商业理念与实践尤为重要。这也就是“新人”与“老人”的差异,在技术上其实差异不大,传统上说的“经验”说白了就是商业问题的知识累积与技术融通,不能让知识学习变为问题解决的人,是做不好BI的,更谈不上创新。
 
    如果一位新人进行数据建模工作,面对一堆数据,我想第一个问题是"了解项目目的是什么?"。商业需求分析文件不是放在那里给项目管理者看的,也只是只是为了存档备案,做为真正的实践者,开展工作之前,第一重要的就是了解为什么要做这个项目,搞清楚这些和那些数据结构和关系。那有些人说,我只是做了数据挖掘工作中的一小部分工作,上头交下来什么,我就做好我的三分三不就行了,呵,那么就没什么可说的啦。
 
    商业技术是如何学习和积累的呢?首先确定自身所处行业的大范围,再逐个理解数据表的商业背景与定义,约束关系以及和其他表的关系。例如需要分析客户、交易结果、业务服务的数据。一般来说,这个范围是可以缩小的,一般行业的通用数据知识表可以控制在20个以内,沿着这些表之间的关系,能够引出一些新的需要分析的表。
 
   有了业务积累与数据结构,其实在你的脑中就有了个概念模型,在面对数据挖掘项目时就可以快速切入重点,在纷繁的表、字段中,你真正需要关注的字段其实并不多,需要通过之前的表间关系与技术手段将它们挑选出来,重点描述,发现异常数据、正确的补缺方法、选择最合适的挖掘技术模型。
 
    在从新手走向熟练矿工的道路上,以下几项工作是每天要去做的:
1、商业分析——了解商业背景,关注行业动向与各类分析主题
2、目的分析——在开工之前,最重要的就是了解项目目的,能谈多透就多透
3、数据分类——根据项目主题缩小数据范围,检查数据质量,找寻关键变量
4、技术提升——数据挖掘技术是立身之本,不但要知道怎么用,更要了解算法
 
    数据挖掘只是一种技术,要真正有效应用,付之于商业实践,要走的路其实很长,往往并不是说你了解什么叫客户分层、知道流失预警、会做交叉营销就能到头的,在如今的商业社会里,我们要更多的把握知识创新的脉搏,从而才能提升价值。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有