加载中…
个人资料
qxp1990
qxp1990
  • 博客等级:
  • 博客积分:0
  • 博客访问:3,678
  • 关注人气:3
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
评论
加载中…
留言
加载中…
图片播放器
友情链接
访客
加载中…
好友
加载中…
博文
置顶: (2018-03-29 17:18)
分类: 数据科学概论

教材

覃雄派,陈跃国,杜小勇. 《数据科学概论》.中国人民大学出版社. ISBN: 9787300252926.

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

数据科学离不开计算机(包括数据库、数据挖掘、机器学习等),数据科学离不开统计学。这几乎已经是大家的共识了。

但是在数据科学的旗帜下,如何摆放计算机、和统计学,如何融合计算机和统计学,却不是那么容易。统计学家,习惯于用模型来套数据,用模型来套世界。比如对于时间序列数据,统计学家推出了

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

时序数据和轨迹数据是重要的数据类型,在《数据科学概论》第二版中,作者将把这两章内容纳进来。预览版已经放到《数据科学概论》配套资源网站的“PPT” 一节,读者可以开始下载(非营利用途)

 

http://xiongpai.freecluster.eu/download.html

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2018-08-30 23:22)
标签:

sql

mysql

分类: 数据科学概论

关系数据库的查询语言SQL,是一门易学易用的语言。用于对数据库进行数据的增加、删除、修改、简单查询和多维度汇总查询。

学习SQL的有效方法是看别人写的实例,熟读唐诗300首,不会作诗也会吟。

网址https://pan.baidu.com/s/1wDYsAuqYCyABhRklHzyo5A,给出了SQL的快速入门。

而网址http://blog.sina.com.cn/s/blog_55d99cc20102xf1s.html则告诉大家如何在windows10

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
2018年9月1日,笔者利用假期完成了该书电子版的第一次校稿,可读性、正确性提高一大截,下载网址不变,大家可以登录下述网址下载最新版本。

笔者编写了一本书《Hadoop&Spark原理、运维、与开发》,电子版免费贡献出来,供大家下载。正如书名所示,该书涵盖技术原理、安装配置、基本的开发等三个方面的内容。寥寥100多页的篇幅,使得大家对大数据工具HadoopSpark有一个初步的认识。

 

读者可以从http://xiongpai.freecluster.eu/download.html《数据科学概论》教学资源下载网站的首页下载。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

1.前言

本文给出了一个简单的数据仓库模型,事实表保存销售记录,维表保存用户、时间、产品、销售人员、商店等信息,这些维表具有维度的层次结构。比如时间维度的年、月、日等。

在这个数据仓库上,我们可以运行数据仓库分析查询,获得一些汇总结果,帮助我们对业务有所了解,以便安排后续的商业活动。

本实例的目的是让读者对关系数据库、OLAP、事实表、维表、维度层次结构等,有进一步的认识。

这些内容的原理,请参考覃雄派、陈跃国、杜小勇《数据科学概论》教材的相关内容。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

1.前言

本文给出了一个简单的银行核心业务数据库,支持用户对自己的活期存款账户进行操作,包括开户、存款、取款、转账、查询账户余额等。

此外,还提供了对账户信息进行汇总统计的一些查询。

注意:对于实际的活期存款,还应该有一个计息操作。

本实例的目的,是让读者对关系数据库、OLTP、事务处理、SQL语句等,有进一步的认识。这些技术的原理,请参考覃雄派、陈跃国、杜小勇《数据科学概论》教材的相关内容。

备注:本文档仅部分验证,如果有错,

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

本文给出了一个非常小的神经网络。在这个网络上,把反向传播算法的核心逻辑给讲清楚(这是相当不得了的,是作者的得意之作)。

1,网络结构

整个网络结构只有两个神经元,一个是输入层的神经元,也就是输入层只有一个神经元,一个输出层的神经元,也就是输出层只有一个神经元。如图所示。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

1.什么是绿色版

绿色版是一个zip包,解压缩到某个目标目录以后,修改好配置文件,即完成安装。无需运行安装程序。

备注:本文档仅部分验证,如果有错,请通知qxp1990@ruc.edu.cn覃老师。

 

2.mysql绿色版安装过程

在这里使用的软件

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

前言

知识是有架构的,这就是所谓的知识体系。学习是有路线图的(对学生而言),对老师来讲就是教学计划。

 

《数据科学概论》的知识体系

数据科学概论,由理论部分和应用部分构成。形成两条线索,两个T型,如图所示。



理论部分,先由浅入深,再宽度展开,旨在培养学生宽广的视野,形成完整的知识体系。

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

    如何对服务器硬件和软件进行监控,一款优秀的监控软件是必需的,prometheus就是这样的一款监控软件。
    它支持大量的数据库、应用服务器的监控(通过...exporter,本质上是一个agent),当然prometheus也支持节点的监控,包括cpu/mem/disk/network的使用情况。
// --------------------------------------------------------------------------------
参考文献
https://www.digitalocean.com/community/tutorials/how-to-use-prometheus-to-monitor-your-ubuntu-14-04-server

// --------------------------------------------------------------------------------
下载地址
https://github.com/prometheus/prometh
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有