[转载]推荐22个免费的数据可视化分析工具

标签:
转载 |
I-数据清理(Data cleaning)
在分析数据和数据可视化之前,常需要对原始数据进行格式归一化的整理,比如(1)关于“New York”的一些输入性列表,可能会有“New York City”,“New York”或“NY”等不同的表达形式;(2)度量单位亦有可能包括米、厘米、英尺或英寸等。因此,在数据分析之前首先就需要对原始数据进行标准化(或归一化)处理,这里介绍两款用于数据清理(Data cleaning)的免费工具。
斯坦福大学可视化组(Stanford University's Visualization Group,SUVG)设计的基于web的服务,用来清理和重列数据。点击一个行或列,DataWrangler会弹出建议变化。比如如果你点击了一个空行,一些建议弹出,删除或删除空行的提示。它的文本编辑很cooool。
[tip1]:该软件只能在Chrome,Safari和Firefox浏览器中运行。
2、Google Refine
Google
Refine。用户在电脑上运行这个应用程序后就可以通过浏览器访问之。这个东西的主要功能是帮用户整理数据,接下来的演示视频效果非常好:用户下载了一个CSV文件,但是同一个栏中的同一个属性有多种写法:全称,缩写,后面加了空格的,单数复数格式不一的。。。但是这些其实都代表了同一个属性,Google
Refine 的作用就是帮你把这些不规范的写法迅速统一起来。
II-统计分析(Statistical analysis)
3、R项目
R语言是主要用于统计分析、绘图的语言和操作环境。虽然R主要用于统计分析或者开发统计相关的软体,但也有人用作矩阵计算。其分析速度可比美GNU Octave甚至商业软件MATLAB。
Google Fusion
Tables被认为是云计算数据库的雏形。还能够方便合作者在同一个服务器上分享备份,email和上传数据,快速同步不同版本数据,Fusion
Tables可以上传100MB的表格文件,同时支持CSV和XLS格式,当然也可以把Google
Docs里的表格导入进来使用。对于大规模的数据,可以用Google Fusion
Tables创造过滤器来显示你关心的数据,处理完毕后可以导出为csv文件。
Google Fusion Tables的处理大数据量的强大能力,以及能够自由添加不同的空间视图的功能,也许会让Oracle,IBM, Microsoft传统数据库厂商感到担心,Google未来会强力介入数据库市场。
5、Impure
Impure,允许点击、拖曳来连接模块,由西班牙分析公司Bestiario创建。
8、VIDI
10、Choosel
11、Exhibit
14、Protovis
Protovis是一个可以让你利用简单的标记如线条和圆点+数据来绘制自定义图表。其案例中包括Conventional、Custom、Interaction、Hierarchies、Networks、Maps、Satistics、Art几个类别,都是非常漂亮的数据图表,喜欢的可以进去详细看下。
16、OpenHeatMap
17、OpenLayers
19、TimeFlow
21、Gephi
22、NodeXL
原文连接:http://www.computerworld.com/s/article/9215504/22_free_tools_for_data_visualization_and_analysis
译文出自:开源中国社区,http://sd.csdn.net/a/20110429/296896.html
»⊙«