加载中…
个人资料
qxp1990
qxp1990
  • 博客等级:
  • 博客积分:0
  • 博客访问:23,173
  • 关注人气:8
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
评论
加载中…
留言
加载中…
友情链接
访客
加载中…
好友
加载中…
博文
标签:

数据科学概论

网上资源

data

science

resources

分类: 数据科学概论

 

请参考最新版本的《数据科学概论》教学大纲Link

资源已经全部挪到在线大纲所在网页。

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

量化交易

分类: 数据科学概论

0101 量化交易简介.pptx
0201
股票基础.pptx
0202
期货基础.pptx
0301 Introduction To Fundamental Analysis.pdf
0301
基本面分析.pptx
0302 Technical Analysis Tutorial.pdf
0302
技术分析.pptx
0401 Python
基础.pptx
0402 Python
PandasNumpy.pptx
0510
机器学习初步.pptx
0601
深度学习初步.pptx
0701
统计分析初步.pptx
0801
数据准备.pptx
0901
基于规则的交易策略.pptx
1001
基于分类的交易策略.pptx
1101
基于回归的交易策略.pptx
1201
基于回归的交易策略(股票间).pptx
1301
基于统计分析的交易策略.pptx
1401
策略参数的优化.pptx
1501
尝试其它算法和算法组合.pptx
1601
基于深度学习模型的交易策略.pptx
1701

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

hadoop

spark

分类: 数据科学概论

(01)《Hadoop/Spark原理、部署、与开发入门》(v2018.09.01)  

(02)hdfs_shell  
(03)hdfs_java[coming soon] 
(04)mapreduce_java  

(05)hbase_shell  
(06)hbase_java[coming soon] 
(07)hive_shell  
(08)hive_hiveserver2_beeline  
(09)hive_java  

(10)

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

数据科学概论

大数据

三个v

实验

分类: 数据科学概论

1Volume实验

        要求:在助教协助下,利用云平台进行Word Count MapReduce实验(或者Sort/Inverted Index

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

数据科学

统计分析

数学建模

分类: 数据科学概论

数据科学具有跨学科的特点。数据科学包含什么内容,如何构建其内容体系,众说纷纭。公说公有理,婆说婆有理,场面一时纷纷嚷嚷。

本文的主要观点是,数据科学一定离不开计算机。换句话说,没有计算机的数据科学,可能是假的数据科学。

有些“数据科学”课程,其核心内容是统计分析和数学建模。在数据科学概念正式提出来之前,这样的课程,也有,也能够叫出名字。无他,就是统计分析或者数学建模。现在戴上了一个新帽子,就是数据科学了?很显然,问题很大。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

数据治理

国家治理

社会治理

分类: 数据科学概论

数据治理是一个国际公认的概念,对应的英文是data governance。它的核心内容是利用政策、人员、技术手段,基于主数据管理、元数据管理等,对数据的质量、生命周期、安全/隐私/共享、合规性等进行管理,实现数据价值,管控数据风险。

有些人把基于数据的国家

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

数据科学概论

python

上机

练习

分类: 数据科学概论

Python与机器学习初步

备注:仅用于检验python语言的学习效果,面向数据分析和处理,做编程练习。

整个数据科学概论的教学大纲(包括其他上机练习),请参考link

Python与机器学习初步

1(决策树-易)

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

统计学

人工智能

分类: 数据科学概论

    20188月,诺贝尔奖获得者、统计学家Thomas J Sargent在世界科技创新论坛上表示,人工智能其实就是统计学,只不过用了一个很华丽的辞藻。好多的公式都非常老,我们说所有的人工智能利用的都是统计学来解决问题。

面对统计学家自我感觉良好的幻觉AI研究者纷纷坐不住了。

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

数据科学

大数据

统计分析

机器学习

分类: 数据科学概论

数据科学不能等同于大数据

有些人把数据科学等同于大数据,一上来,就用几个V(Volume, Velocity, Variety, Veracity)来划分和把握数据科学的内容,或者用几个V来构造数据科学的内容体系。这是很成问题的。

1)首先,数据科学是关于数据的科学,它研究数据的方方面面,所以不管是大数据还是小数据、中数据,都是数据科学应该研究的对象。(2)另外,大数据的“大”是一个相对的概念,今年的大,不一定是明年的大。读者一定有感受,几年前你的手机内存有1G都算大了,现在的新手机6G的内存起步,你说哪个是所谓的大内存?我们应该关注数据,数据的价值。管你大还是不大。

 

数据科学不能等同于机器学习

有些数据科学的教材,核心内容就是机器学

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

数据科学

计算机

统计学

融合

分类: 数据科学概论

数据科学离不开计算机(包括数据库、数据挖掘、机器学习等),数据科学离不开统计学。这几乎已经是大家的共识了。

但是在数据科学的旗帜下,如何摆放计算机、和统计学,如何融合计算机和统计学,却不是那么容易。统计学家,习惯于用模型来套数据,用模型来套世界。比如对于时间序列数据,统计学家推出了

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

数据科学概论

book

chapter

时间序列分析

轨迹数据分析

分类: 数据科学概论

时序数据和轨迹数据是重要的数据类型,在《数据科学概论》第二版中,作者将把这两章内容纳进来。预览版已经放到《数据科学概论》配套资源网站的“PPT” 一节,读者可以开始下载(非营利用途)

 

数据科学概论网上资源link


阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有