加载中…
个人资料
qxp1990
qxp1990
  • 博客等级:
  • 博客积分:0
  • 博客访问:7,070
  • 关注人气:5
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
评论
加载中…
留言
加载中…
图片播放器
友情链接
访客
加载中…
好友
加载中…
博文
置顶: (2018-03-29 17:18)
分类: 数据科学概论

备注:

    最新版本的《数据科学概论》教学大纲,请参考Link


阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

1. 前言

覃雄派,陈跃国,杜小勇. 数据科学概论. 中国人民大学出版社,2018”出版后,引起了大量的关注。任课老师纷纷表示愿意使用该教材,开设《数据科学概论》课程。

在和一些老师的沟通和交流中,了解到他们反馈的主要问题是,内容稍微有点多,全部讲下来不容易,即便讲下来、面面俱到,也不容易讲清楚,没有重点。

应该对内容有所挑选,给使用本书的老师和同学一个学习路线图,给出本书内容是如何支撑这个

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

    20188月,诺贝尔奖获得者、统计学家Thomas J Sargent在世界科技创新论坛上表示,人工智能其实就是统计学,只不过用了一个很华丽的辞藻。好多的公式都非常老,我们说所有的人工智能利用的都是统计学来解决问题。

面对统计学家自我感觉良好的幻觉AI研究者纷纷坐不住了。

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

数据科学不能等同于大数据

有些人把数据科学等同于大数据,一上来,就用几个V(Volume, Velocity, Variety, Veracity)来划分和把握数据科学的内容,或者用几个V来构造数据科学的内容体系。这是很成问题的。

1)首先,数据科学是关于数据的科学,它研究数据的方方面面,所以不管是大数据还是小数据、中数据,都是数据科学应该研究的对象。(2)另外,大数据的“大”是一个相对的概念,今年的大,不一定是明年的大。读者一定有感受,几年前你的手机内存有1G都算大了,现在的新手机6G的内存起步,你说哪个是所谓的大内存?

 

数据科学不能等同于机器学习

有些数据科学的教材,核心内容就是机器学习,也就是把机器学习改头换面成数据科学。把数据

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

《数据科学概论》课程设计

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

数据科学离不开计算机(包括数据库、数据挖掘、机器学习等),数据科学离不开统计学。这几乎已经是大家的共识了。

但是在数据科学的旗帜下,如何摆放计算机、和统计学,如何融合计算机和统计学,却不是那么容易。统计学家,习惯于用模型来套数据,用模型来套世界。比如对于时间序列数据,统计学家推出了

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

时序数据和轨迹数据是重要的数据类型,在《数据科学概论》第二版中,作者将把这两章内容纳进来。预览版已经放到《数据科学概论》配套资源网站的“PPT” 一节,读者可以开始下载(非营利用途)

 

数据科学概论网上资源

http://blog.sina.com.cn/s/blog_55d99cc20102yapo.html


阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2018-08-30 23:22)
标签:

sql

mysql

分类: 数据科学概论

关系数据库的查询语言SQL,是一门易学易用的语言。用于对数据库进行数据的增加、删除、修改、简单查询和多维度汇总查询。

学习SQL的有效方法是看别人写的实例,熟读唐诗300首,不会作诗也会吟。

网址http://mail.sina.com.cn/netdisk/download.php?id=ff0a80e58fed370c629d1ac4367ce50960,给出了SQL的快速入门。

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
2018年9月1日,笔者利用假期完成了该书电子版的第一次校稿,可读性、正确性提高一大截,下载网址不变,大家可以登录下述网址下载最新版本。

笔者编写了一本书《Hadoop&Spark原理、运维、与开发》,电子版免费贡献出来,供大家下载。正如书名所示,该书涵盖技术原理、安装配置、基本的开发等三个方面的内容。寥寥100多页的篇幅,使得大家对大数据工具HadoopSpark有一个初步的认识。

 

读者可以从http://blog.sina.com.cn/s/blog_55d99cc20102yapo.html《数据科学概论》教学资源下载网站的首页下载。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

1.前言

本文给出了一个简单的数据仓库模型,事实表保存销售记录,维表保存用户、时间、产品、销售人员、商店等信息,这些维表具有维度的层次结构。比如时间维度的年、月、日等。

在这个数据仓库上,我们可以运行数据仓库分析查询,获得一些汇总结果,帮助我们对业务有所了解,以便安排后续的商业活动。

本实例的目的是让读者对关系数据库、OLAP、事实表、维表、维度层次结构等,有进一步的认识。

这些内容的原理,请参考覃雄派、陈跃国、杜小勇《数据科学概论》教材的相关内容。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

1.前言

本文给出了一个简单的银行核心业务数据库,支持用户对自己的活期存款账户进行操作,包括开户、存款、取款、转账、查询账户余额等。

此外,还提供了对账户信息进行汇总统计的一些查询。

注意:对于实际的活期存款,还应该有一个计息操作。

本实例的目的,是让读者对关系数据库、OLTP、事务处理、SQL语句等,有进一步的认识。这些技术的原理,请参考覃雄派、陈跃国、杜小勇《数据科学概论》教材的相关内容。

备注:本文档仅部分验证,如果有错,

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有