1. 问题的由来
相信大多数数据挖掘(准确的说数据仓库挖掘 MSR
)爱好者,都热衷于通过软件开发过程中的种种数据来挖掘出我们想要的模式,经验,或者未知的东西。因此,之前 MSR 社区研究者经常活跃在
SVN,CVS 等代码管理系统上,自从 2008 年 GitHub 出生以后,大多数人的目光逐渐转移到了 GitHub
这个如今最大的开源代码托管平台上了,人们希望得到 GitHub
上项目开发过程中的种种数据,包括项目开发者信息,代码库信息,提交信息,合并信息,bug 信息等等。
为了方便人们进入更深次的研究,GitHub 决定开放其接口,便于人们通过接口的调用形式来获取相应的信息。接口名字为REST
API (已更新到第三版,故又称 REST API v3) [4]。原理也很简单,就是用过 GET 等基本 http
请求来想接口进行请求,然后服务器 (
https://api.github.com/) [5] 返回结果。例如,我想要查询名字叫
Gu-Youngfeng 这个开发者 (正是鄙人) 的信息,我可以在浏览器中输入,
Pie图,顾名思义就是饼状图的意思,一般我们通过饼状图能够快速了解到统计数据的大致分布,例如一个公司中的男女的比例,一个部门各个学历的比例等等,在
matlab 中使用也很简单,直接调用
pie(x) 函数即可,下面给出一个简单的例子。
x =
[526 474];
pie(x); % 简单调用pie函数做出饼状图
title('计算机学院男女比例饼状图');
经过简单的修饰 explode,标注 legend, 其中若要某一部分突出显示,则可以加 explode
数组,然后在 pie 函数中添加 explode 即可,下面给出一个简单例子