加载中…
个人简介
水击三千里,扶摇九万里。

一位普通的数据工作者 在数据中观察生活,在数据中享受工作。

微博:http://weibo.com/720089108
个人资料
让数据说话
让数据说话
  • 博客等级:
  • 博客积分:0
  • 博客访问:18,533
  • 关注人气:75
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
访客
加载中…
好友
加载中…
评论
加载中…
留言
加载中…
博文
标签:

转载

分类: 统计与多元统计

一、数据草堂:http://www.itongji.cn/hao/

 

 

 

 

阅读  ┆ 评论  ┆ 转载原文 ┆ 收藏 
(2012-02-13 12:28)
安斯康比四重奏 由完全一致的简单统计属性的四组数据集组成,但是当画图时它们确截然不同。



 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

转载

分类: 商务智能BI

与十年前不同,当今令数据分析师迷茫的,可能不再是数据很少,而是数据很多;今天不是不知道玩好数据的重要性,而是不知道玩错数据的危害性,即所谓甜蜜的烦恼。一个数据分析师,如果能体会到,当下数据存在的核心问题,并且能清楚解决办法,就可以精益求精了。

 

阅读  ┆ 评论  ┆ 转载原文 ┆ 收藏 
标签:

转载

阅读  ┆ 评论  ┆ 转载原文 ┆ 收藏 

原文如下:

2010-09-25 09:46   来源:中关村在线

  IBM周四宣布将在欧洲启动三个数据分析中心。本周早些时候宣布IBM以17亿美元收购了数据分析公司Netezza,此举凸显了IBM拓展自身商业分析业务的决心。

  IBM表示,这三个数据分析中心分别位于瑞士苏黎世、匈牙利布达佩斯以及奥地利维也纳。每个中心都将分别专注于特定的行业和分析问题,从而对IBM全球其他7个数据分析中心形成补充。

  苏黎世数据分析中心将专注于金融服务和公共行业数据分析,诈骗、金融、品牌及声誉、交通管理均为重点关注领域。同时还负责IBM的“智能城市(Smarter Cities)”项目的数据收集和分析工作。

  在布达佩斯数据分析中心,IBM将招募学生进行职业生涯的数据分析

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

    为了提高企业的绩效,某钢铁企业的高层管理者向下属提出这样的命题:0.04的钢和0.06的钢各炼多少企业的效益可以达到最高?

    首先从应用的角度出发:效益与成本、市场需求、产品市场占有率和产品定价有关系,成本包括原材料如矿石、上游物流运输、库存的成本和辅料的成本,这些信息在企业的采购系统中;绩效与人力成本有关,在人力资源系统中;与企业的生产能力有关,在企业的ERP系统中;与企业明年客户的需求(这些可以从去年客户订单中预测—在客户关系管理系统中)、产品的定价、竞争对手的盈利能力、市场的需求等有关,这些信息在第三方的数据和预测的结果中;

要解决这样的问题,自然就会问道:

    一是数据来源能否整合起来,也就是建立支持生产运营、营销和财务分析等的数据仓库;

    二是利用什么样的模型和如何进行分析,也就是利用的工具和分析方法;

    三是谁来分析:很多人认为这应该是IT部门的事情,有些人认为是战略规划部门的事情,有些人认为是营销部门的事情,到底是谁的事情?

看来这里就不得不来探讨商务智能能力中

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

    用截面数据作为计量经济学模型的样本数据,应注意以下几个问题。一是样本与母体的一致性问题。计量经济学模型的参数估计,从数学上讲,是用从母体中随机抽取的个体样本估计母体的参数,那么要求母体与个体必须是一致的。例如,估计煤炭企业的生产函数模型,只能用煤炭企业的数据作为样本,不能用煤炭行业的数据。那么,截面数据就很难用于一些总量模型的估计,例如,建立煤炭行业的生产函数模型,就无法得到合适的截面数据。
 

计量经济模型(Econometric Model)
 

计量经济模型概述

 

  计量经济模型包括一个或一个以上的随机方程式,它简洁有效地描述、概括某个真实经济系统的数量特征,更深刻地揭示出该经济系统的数量变化规律。是由系统或方程组成,方程由变量和系数组成。其中,系统也是由方程组成。计量经济模型揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述。
广义地说,一切包括经济、数学、统计三者的模型;  
狭义地说,仅只用参数估计和假设检验的数理
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
     自举法是在1个容量为n的原始样本中重复抽取一系列容量也是n的随机样本,并保证每次抽样中每一样本观察值被抽取的概率都是1/n(复置抽样)。这种方法可用来检查样本统计数θ的基本性质,估计θ的标准误和确定一定置信系数下θ的置信区间。
      自助法(Bootstrap Method)是Efron(1979)於Annals of Statistics所发表的一个办法,是近代统计发展上极重要的一个里程碑,而在执行上常需借助於现代快速的电脑。 
      举例来说,当用样本平均来估算母群体期望值时,为对此一估算的误差有所了解,我们常用信赖区间(confidence interval)的办法来做推估,此时得对样本平均的sampling distribution有所了解。在基本统计教本上,当样本所来自的母群体,可用常态分配描述时,其sampling distribution可或为常态分配或为t分配。但当样本所来自的母群体,不宜用常态分配描述时,我们或用电脑模拟或用渐进分析的办法加以克服。当对母群体的了解不够深时,渐进分析的办法是较有效的方法,故中央极限定理(Central Limit Theorem),Edgeworth Expansion (small sample theory)等办法
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

    3月31日上午消息,淘宝网今日正式宣布,将面向全球首度开放淘宝数据,淘宝将按照有原则、分层次地开放淘宝数据,涉及宏观及消费风向标的数据淘宝将免费开放,涉及市场情况、消费者行为的商业数据淘宝将通过商业方式开放。

    据了解,淘宝此次向全球开放数据将有两条大原则其一,淘宝数据将会分层次开放;其二,涉及消费者个人或者企业自身隐私的数据绝对保护。

    在此大原则下,淘宝数据将分为三个层面进行开放其一,涉及电子商务行业的宏观数据,以及让消费者了解最新消费风向标的数据,淘宝将实行免费开放策略;其二,涉及各个行业市场情况、消费者行为研究等商业数据,淘宝将通过商业方式开放;其三,涉及消费者个人隐私、企业商业隐私数据,淘宝绝对保护,防止任何泄漏。

    淘宝商户平台事业部总经理喻策表示,淘宝构建的不是封闭商业模式,是开放商业生态系统;未来电子商务核心竞争优势来源于,对于数据的解读能力以及配合数据变化的快

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

野田圣子----从洗马桶到邮政大臣

野田圣子 196093日生于日本福冈县,1983年毕业于上智大学外国语系比较文化专业,同年进入东京帝国饭店工作。但没想到上司竟安排她做洗厕工,每天都必须将马桶擦洗得光洁如新。心理作用使她几欲作呕。本想立即辞去这份工作,但她又不甘心自己刚刚走上社会就败下阵来。因为她初来时曾经发誓:一定要走好人生的第一步!

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 不良信息反馈 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有