加载中…
博文

数据分析、SAS、EXCEL、SQL和PPT等资料汇总

更新时间:2012年10月15日


写在前面

学习要学会寻找资源,在这推荐大家几个我经常逛的网站。

数据分析网:比较全面的数据分析网站,汇总了很多学习资源。

数据小兵:很nice的一个博客,专注spss分析思路、案例的分享。

人大经济论坛:国内最大的经济管理方面的论坛,其中计量经济板块涉及很多数据分析、数据挖掘的资料、经验、问题。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
长期招聘资深数据分析师/杭州/3年以上经验/发展空间大/有竞争力的待遇
base:杭州 拱墅区
有意者,发送简历到邮箱:zhenglaiyi@163.com
长期有效

一、     

阅读  ┆ 评论  ┆ 禁止转载 ┆ 收藏 
(2015-08-15 00:56)

★2009年04月23日,我注册了新浪博客,正式成为一名博主。
★2009年04月24日,我发表了第一篇博文,阅读:249。
★2009年08月10日,我关注的第一名博主:小蚊子数据分析。
★2015年08月15日,我的博客等级是19
★累计发表351篇文章
★524139人阅读过
★1467人关注我
★566人评论过
★和217人建立了好友关系

 

新浪博客停止更新。。。。。。

博客新地址:

http://www.afenxi.com/author/zhenglaiyi

阅读  ┆ 禁止转载 ┆ 收藏 
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

很多和MYSQL雷同,不知道哪位同学整理的,分享给大家。

第一部分:关系运算

Hive支持的关系运算符

•常见的关系运算符

•等值比较: =

•不等值比较: <>

•小于比较: <</div>

•小于等于比较: <=

•大于比较: >

•大于等于比较: >=

•空值判断: IS NULL

•非空判断: IS NOT NULL

•LIKE比较: LIKE

•JAVA的LIKE操作: RLIKE

•REGEXP操作: REGEXP

•等值比较: =

语法:A=B

操作类型:所有基本类型

描述: 如果表达式A与表达式B相等,则为TRUE;否则为FALSE

举例:

select 1 from dual where 1=1;

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

数据分析

郑来轶

python

分类: 08.Python
Python的特色

简单
Python是一种代表简单主义思想的语言。阅读一个良好的Python程序就感觉像是在读英语一样,尽管这个英语的要求非常严格!Python的这种伪代码本质是它最大的优点之一。它使你能够专注于解决问题而不是去搞明白语言本身。

易学
就如同你即将看到的一样,Python极其容易上手。前面已经提到了,Python有极其简单的语法。

免费、开源
Python是FLOSS(自由/开放源码软件)之一。简单地说,你可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自由软件中。FLOSS是基于一个团体分享知识的概念。这是为什么Python如此优秀的原因之一——它是由一群希望看到一个更加优秀的Python的人创造并经常改进着的。

高层语
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

数据分析

郑来轶

python

分类: 08.Python

简介

Python语言是少有的一种可以称得上即简单功能强大的编程语言。你将惊喜地发现Python语言是多么地简单,它注重的是如何解决问题而不是编程语言的语法和结构。

Python的官方介绍是:

Python是一种简单易学,功能强大的编程语言,它有高效率的高层数据结构,简单而有效地实现面向对象编程。Python简洁的语法和对动态输入的支持,再加上解释性语言的本质,使得它在大多数平台上的许多领域都是一个理想的脚本语言,特别适用于快速的应用程序开发。

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

郑来轶

数据分析

python

分类: 08.Python

Python语言可能是第一种即简单又功能强大的编程语言(PS:老外取名字很有意思,大象、蜜蜂、蛇等等,Python的英文是蟒蛇,logo也是2蛇扭在一起)。它不仅适合于初学者,也适合于专业人员使用,更加重要的是,用Python编程是一种愉快的事。本身将帮助你学习这个奇妙的语言,并且向你展示如何即快捷又方便地完成任务——真正意义上“为编程问题提供的完美解决方案!”

本教程的读者

 

阅读  ┆ 评论  ┆ 禁止转载 ┆ 收藏 

博客地址:

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

什么是相关系数?或称线性相关系数、皮氏积矩相关系数(Pearson product-moment correlation coefficient, PPCC)等,是衡量两个随机变量之间线性相关程度的指标。它由卡尔·皮尔森(Karl Pearson)在1880年代提出,现已广泛地应用于科学的各个领域。

相关系数的计算公式
r=\frac{\sigma{xy}}{\sigma_x\sigma_y}

相关系数的值介于–1与 1之间,即–1≤r

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

数据分析、市场研究、产品质量检测,不可能像人口普查那样,进行全量的进行研究,这就需要用到抽样分析技术。什么是抽样呢?就是从总体中抽取一部分样本进行研究分析,用来估计和推断总体的情况,是数据分析里面很基础的一个统计方法,抽样有简单随机、系统、分层、整群等等类型。

一、案例场景

有一列用户ID(非文本/字符),我想通过抽样的方式抽取5个进行进一步的数据分析。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 不良信息反馈 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有