加载中…
个人资料
qxp1990
qxp1990
  • 博客等级:
  • 博客积分:0
  • 博客访问:14,640
  • 关注人气:7
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
评论
加载中…
留言
加载中…
图片播放器
友情链接
访客
加载中…
好友
加载中…
博文
置顶: (2018-03-29 17:18)
分类: 数据科学概论

备注:

    最新版本的《数据科学概论》教学大纲,请参考Link


阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

量化交易

分类: 数据科学概论
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

hadoop

spark

分类: 数据科学概论
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

1Volume实验

        要求:在助教协助下,利用云平台进行Word Count MapReduce实验(或者Sort/Inverted Index

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

数据科学具有跨学科的特点。数据科学包含什么内容,如何构建其内容体系,众说纷纭。公说公有理,婆说婆有理,场面一时纷纷嚷嚷。

本文的主要观点是,数据科学一定离不开计算机。换句话说,没有计算机的数据科学,可能是假的数据科学。

有些“数据科学”课程,其核心内容是统计分析和数学建模。在数据科学概念正式提出来之前,这样的课程,也有,也能够叫出名字。无他,就是统计分析或者数学建模。现在戴上了一个新帽子,就是数据科学了?很显然,问题很大。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

数据治理是一个国际公认的概念,对应的英文是data governance。它的核心内容是利用政策、人员、技术手段,基于主数据管理、元数据管理等,对数据的质量、生命周期、安全/隐私/共享、合规性等进行管理,实现数据价值,管控数据风险。

有些人把基于数据的国家

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

Python与机器学习初步

备注:仅用于检验python语言的学习效果,面向数据分析和处理,做编程练习。

整个数据科学概论的教学大纲(包括其他上机练习),请参考link

Python与机器学习初步

1(决策树-易)

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

    20188月,诺贝尔奖获得者、统计学家Thomas J Sargent在世界科技创新论坛上表示,人工智能其实就是统计学,只不过用了一个很华丽的辞藻。好多的公式都非常老,我们说所有的人工智能利用的都是统计学来解决问题。

面对统计学家自我感觉良好的幻觉AI研究者纷纷坐不住了。

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

数据科学不能等同于大数据

有些人把数据科学等同于大数据,一上来,就用几个V(Volume, Velocity, Variety, Veracity)来划分和把握数据科学的内容,或者用几个V来构造数据科学的内容体系。这是很成问题的。

1)首先,数据科学是关于数据的科学,它研究数据的方方面面,所以不管是大数据还是小数据、中数据,都是数据科学应该研究的对象。(2)另外,大数据的“大”是一个相对的概念,今年的大,不一定是明年的大。读者一定有感受,几年前你的手机内存有1G都算大了,现在的新手机6G的内存起步,你说哪个是所谓的大内存?我们应该关注数据,数据的价值。管你大还是不大。

 

数据科学不能等同于机器学习

有些数据科学的教材,核心内容就是机器学

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

 

请参考最新版本的《数据科学概论》教学大纲Link

资源已经全部挪到在线大纲所在网页。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

数据科学离不开计算机(包括数据库、数据挖掘、机器学习等),数据科学离不开统计学。这几乎已经是大家的共识了。

但是在数据科学的旗帜下,如何摆放计算机、和统计学,如何融合计算机和统计学,却不是那么容易。统计学家,习惯于用模型来套数据,用模型来套世界。比如对于时间序列数据,统计学家推出了

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有