《决战大数据》分析有盲点的数据就像是在清水中炼油

标签:
it |
分类: 决战大数据 |
《决战大数据》
如果数据存在盲点,核心数据就无法轻易显现出来。那么,分析有盲点的数据就像是在清水中炼油,虽然耗时耗力,但仍有可能会一无所获。那么,为什么有人能在相同的数据中找出关键点,有人却视若无睹?从大数据时代出发,在思考的过程中,有一个问题必须得到解决,那就是假定数据都是可以获得的情况下,什么样的数据才是关键?
既然谈到了盲点,就必须要对盲点下一个定义。我们通常意义上的盲点指的是,眼睛没有看到的现实存在体。数据上的定义也基本类似,就是指被我们无意中忽略了的重要数据或者角度。在数据中,盲点可以分为两类:一类是物理盲点,另一类是逻辑盲点。所谓的物理盲点,就是指在数据库中不存在这样的数据,即企业没有收集到应该收集的数据,这一类数据问题的产生通常是数据
收集策略出了问题。让我们来回顾一下在商品详情页上作标记的这个案例,之前我们在评价某一个商品是不是被用户有效地浏览时,使用的数据指标是用户在页面上的停留时间,但是这个指标存在天然的缺陷。首先,停留时间不完全代表用户对商品的喜好。在企业收集到的数据场景中,有很大一部分可能是用户的无意识停留行为,比如,用户刚打开网页,就被领导叫出去开会或谈话等,而这种情况导致用户在某些页面停留时间过长的数据就没有收集的必要。其次,停留时间通常情况下不容易计算清楚。在传统的日志模式下,停留时间都是按照下一个页面打开的时间作为上一个页面结束的时间。当一个人在多个窗口同时停留时,则会陷入停留时间过短的误区。在要评价用户是否对页面感兴趣时,数据就出现了物理盲点——企业没有精确的数据来描述用户是否对商品感兴趣。