加载中…
个人资料
qxp1990
qxp1990
  • 博客等级:
  • 博客积分:0
  • 博客访问:2,972
  • 关注人气:4
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
评论
加载中…
留言
加载中…
图片播放器
友情链接
访客
加载中…
好友
加载中…
博文
置顶: (2018-03-29 17:18)
分类: 数据科学概论

教材

覃雄派,陈跃国,杜小勇. 《数据科学概论》.中国人民大学出版社. ISBN: 9787300252926.

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2018-08-30 23:22)
标签:

sql

mysql

分类: 数据科学概论

关系数据库的查询语言SQL,是一门易学易用的语言。用于对数据库进行数据的增加、删除、修改、简单查询和多维度汇总查询。

学习SQL的有效方法是看别人写的实例,熟读唐诗300首,不会作诗也会吟。

网址https://pan.baidu.com/s/1wDYsAuqYCyABhRklHzyo5A,给出了SQL的快速入门。

而网址http://blog.sina.com.cn/s/blog_55d99cc20102xf1s.html则告诉大家如何在windows10

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
2018年9月1日,笔者利用假期完成了该书电子版的第一次校稿,可读性、正确性提高一大截,下载网址不变,大家可以登录下述网址下载最新版本。

笔者编写了一本书《Hadoop&Spark原理、运维、与开发》,电子版免费贡献出来,供大家下载。正如书名所示,该书涵盖技术原理、安装配置、基本的开发等三个方面的内容。寥寥100多页的篇幅,使得大家对大数据工具HadoopSpark有一个初步的认识。

 

读者可以从http://xiongpai.freecluster.eu/download.html《数据科学概论》教学资源下载网站的首页下载。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

1.前言

本文给出了一个简单的数据仓库模型,事实表保存销售记录,维表保存用户、时间、产品、销售人员、商店等信息,这些维表具有维度的层次结构。比如时间维度的年、月、日等。

在这个数据仓库上,我们可以运行数据仓库分析查询,获得一些汇总结果,帮助我们对业务有所了解,以便安排后续的商业活动。

本实例的目的是让读者对关系数据库、OLAP、事实表、维表、维度层次结构等,有进一步的认识。

这些内容的原理,请参考覃雄派、陈跃国、杜小勇《数据科学概论》教材的相关内容。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

1.前言

本文给出了一个简单的银行核心业务数据库,支持用户对自己的活期存款账户进行操作,包括开户、存款、取款、转账、查询账户余额等。

此外,还提供了对账户信息进行汇总统计的一些查询。

注意:对于实际的活期存款,还应该有一个计息操作。

本实例的目的,是让读者对关系数据库、OLTP、事务处理、SQL语句等,有进一步的认识。这些技术的原理,请参考覃雄派、陈跃国、杜小勇《数据科学概论》教材的相关内容。

备注:本文档仅部分验证,如果有错,

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

本文给出了一个非常小的神经网络。在这个网络上,把反向传播算法的核心逻辑给讲清楚(这是相当不得了的,是作者的得意之作)。

1,网络结构

整个网络结构只有两个神经元,一个是输入层的神经元,也就是输入层只有一个神经元,一个输出层的神经元,也就是输出层只有一个神经元。如图所示。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

1.什么是绿色版

绿色版是一个zip包,解压缩到某个目标目录以后,修改好配置文件,即完成安装。无需运行安装程序。

备注:本文档仅部分验证,如果有错,请通知qxp1990@ruc.edu.cn覃老师。

 

2.mysql绿色版安装过程

在这里使用的软件

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

前言

知识是有架构的,这就是所谓的知识体系。学习是有路线图的(对学生而言),对老师来讲就是教学计划。

 

《数据科学概论》的知识体系

数据科学概论,由理论部分和应用部分构成。形成两条线索,两个T型,如图所示。



理论部分,先由浅入深,再宽度展开,旨在培养学生宽广的视野,形成完整的知识体系。

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

    如何对服务器硬件和软件进行监控,一款优秀的监控软件是必需的,prometheus就是这样的一款监控软件。
    它支持大量的数据库、应用服务器的监控(通过...exporter,本质上是一个agent),当然prometheus也支持节点的监控,包括cpu/mem/disk/network的使用情况。
// --------------------------------------------------------------------------------
参考文献
https://www.digitalocean.com/community/tutorials/how-to-use-prometheus-to-monitor-your-ubuntu-14-04-server

// --------------------------------------------------------------------------------
下载地址
https://github.com/prometheus/prometh
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
// --------------------------------------------------------------------------------
(1)好多软件包,目前仅仅支持python 2.7。
所以,我们安装python 2.7,以便进行数据科学实验。

(2)有少量的软件包,目前仅仅支持python 3.5,比如tensorflow,那怎么办?
我们可以在python 2.7下建立一个python 3.5的环境env,然后激活它,安装必要的
软件包,就可以安装相关软件和进行实验了。

其它文章已经讲述(1)。
本文讲述(2)。
// --------------------------------------------------------------------------------
在anaconda python 2.7环境下,创建anaconda python 3.5环境(env)
    备注:目的是做些tensorflow的实验

    参考文献
    https://chrisconlan.com/installing-python-opencv-3-windows/

// --------------------------------------------------------------------------------
创建python 3.5环境,安装opencv

1,运行annaconda2(64bit)程序组的Anaconda Prompt
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
// ---------------------------------------------------------------------------------------
(1)好多软件包,目前仅仅支持python 2.7。
所以,我们安装python 2.7,以便进行数据科学实验。

(2)有少量的软件包,目前仅仅支持python 3.5,比如tensorflow,那怎么办?
我们可以在python 2.7下建立一个python 3.5的环境env,然后激活它,安装必要的
软件包,就可以安装相关软件和进行实验了。

本文讲述(1)。
另外的文章讲述(2)。
// ---------------------------------------------------------------------------------------
安装Anaconda python 2.7
        备注:Anaconda 是python的一个发布版,包含了常用的软件包,不用单独安装

1,去https://www.anaconda.com/download/
下载Anaconda2-5.1.0-Windows-x86_64.exe

2,安装Anaconda

3, 运行annaconda2(64bit)程序组的Anaconda Prompt
conda list
pip list
查看安装了什么软件包

在Anaconda Prompt下,运行如下
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有