加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

《数据科学入门》【PDF】

(2017-11-03 19:05:03)
标签:

数据时代技能书单

数据科学入门

数据科学

pdf

电子书

分类: 大数据与人工智能
《数据科学入门》【PDF】

内容简介

数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为“21世纪头号性感职业。本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。

作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。

通过阅读本书,你可以:

学到一堂Python速成课;

学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的;

掌握如何收集、探索、清理、转换和操作数据;

深入理解机器学习的基础;

运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型;

探索推荐系统、自然语言处理、网络分析、MapReduce和数据库。

作者简介

Joel Grus

Google的一位软件工程师,曾于数家创业公司担任数据科学家。目前住在西雅图,专注于数据科学工作并乐此不疲。偶尔在joelgrus.com发表博客,长期活跃于Twitter @joelgrus

目录

前言  xiii
1章 导论  1
1.1 数据的威力  1
1.2 什么是数据科学  1
1.3 激励假设:DataSciencester  2
1.3.1 寻找关键联系人  3
1.3.2 你可能知道的数据科学家  5
1.3.3 工资与工作年限  8
1.3.4 付费账户  10
1.3.5 兴趣主题  11
1.4 展望  12
2章 Python速成  13
2.1 基础内容  13
2.1.1 Python获取  13
2.1.2 Python之禅  14
2.1.3 空白形式  14
2.1.4 模块  15
2.1.5 算法  16
2.1.6 函数  16
2.1.7 字符串  17
2.1.8 异常  18
2.1.9 列表  18
2.1.10 元组  19
2.1.11 字典  20
2.1.12 集合  22
2.1.13 控制流  23
2.1.14 真和假  24
2.2 进阶内容  25
2.2.1 排序  25
2.2.2 列表解析  25
2.2.3 生成器和迭代器  26
2.2.4 随机性  27
2.2.5 正则表达式  28
2.2.6 面向对象的编程  28
2.2.7 函数式工具  29
2.2.8 枚举  31
2.2.9 压缩和参数拆分  31
2.2.10 args kwargs  32
2.2.11 欢迎来到DataSciencester  33
2.3 延伸学习  33
3章 可视化数据  34
3.1 matplotlib  34
3.2 条形图  36
3.3 线图  40
3.4 散点图  41
3.5 延伸学习  44
4章 线性代数  45
4.1 向量  45
4.2 矩阵  49
4.3 延伸学习  51
5章 统计学  53
5.1 描述单个数据集  53
5.1.1 中心倾向  55
5.1.2 离散度  56
5.2 相关  58
5.3 辛普森悖论  60
5.4 相关系数其他注意事项  61
5.5 相关和因果  62
5.6 延伸学习  63
6章 概率  64
6.1 不独立和独立  64
6.2 条件概率  65
6.3 贝叶斯定理  66
6.4 随机变量  68
6.5 连续分布  68
6.6 正态分布  69
6.7 中心极限定理  72
6.8 延伸学习  74
7章 假设与推断  75
7.1 统计假设检验  75
7.2 案例:掷硬币  75
7.3 置信区间  79
7.4 P-hacking  80
7.5 案例:运行A/B测试  81
7.6 贝叶斯推断  82
7.7 延伸学习  85

...


下载地址:https://u3990681.ctfile.com/fs/3990681-226929254


更多书单和推荐电子书请关注藏书者的新浪博客http://blog.sina.com.cn/cangshuzhe

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有