加载中…

加载中...

正文 字体大小:

量化投资/金工/程序化交易测试回测数据整理汇总(数据来源、数据分享等等)

(2014-06-20 08:51:12)
标签:

matlab

量化投资

数据

回测

分类: 基于MATLAB的量化投资
原帖地址:
量化投资/金工/程序化交易测试回测数据整理汇总(数据来源、数据分享等等)
http://www.matlabsky.com/thread-42850-1-1.html
=======================================================
数据是量化的第一步,只有有了数据回测才能进行(当然回测平台也很重要,这里不做赘述,具体可见 《程序化交易平台介绍整理》 http://www.matlabsky.com/thread-21772-1-1.html)。
其实这帖子一直想做整理,因为碰到好多朋友问数据的问题,获取数据是第一步,后续的数据预处理和清洗也非常重要,得到数据仅仅量化回测的一个很小的开始。

数据源方面无非就两个来源:免费的数据源、付费的数据源。这里要说的是,天下没有免费的午餐,免费的东西虽然免费,但数据质量可能会有问题,这就需要你去权衡和综合考量了。

付费的数据源就不说了,各种金融平台(Wind、DataHouse、Bloomberg、Reuters、IB等等)只要你有账号,根据你账号的不同级别就可以下载到各种市场以及各种频率的数据,还有淘宝上也有数据可以买。付费的数据源这里就不说了,只要你有钱什么数据都能买到,当然虽然付费了,付费的数据源的质量也是良莠不齐,需要甄别。


这里主要说说免费的数据源以及给大家分享一些数据,我这里尽量把我所知道的免费的数据源给大家分享,以及把能分享给大家的数据无偿分享给大家。也希望大家能多多分享以及和我一起补充, 我会代表MATLAB技术论坛给您大量的论坛币奖励。


送人玫瑰,手有余香。
我为人人,人人为我。
stay hungry,stay foolish。


一、免费数据源


1 雅虎财经、新浪财经、谷歌财经等金融网站

数据源:雅虎财经、新浪财经
数据质量:一般
可获取的数据:股票、期货、期权、外汇(理论上只要你知道ticker,雅虎财经可以获取全球的金融市场的任何数据)
说明:
主要是通过MATALB的DataFeed工具箱以及通过网页爬虫抓取两种方式 从雅虎财经、新浪财经获取相关金融数据。具体可以参看以下帖子:
MATLA Datafeed Toolbox简介
http://www.matlabsky.com/thread-21559-1-1.html

Sina股票数据接口(转)
http://www.matlabsky.com/thread-38318-1-1.html

Matlab通过Yahoo与Sina获取历史与实时股票数据[faruto版本]
http://www.matlabsky.com/thread-38988-1-1.html

基于MATLAB的行情软件MatlabTraderGUI V1.1(Beta版本)
http://www.matlabsky.com/thread-37264-1-1.html
matlab编程自动从yahoo获取上证A股所有股票数据
http://www.matlabsky.com/thread-40438-1-1.html

Excel版本从Yahoo获得实时数据和历史数据
http://www.matlabsky.com/thread-22245-1-1.html

VBA源代码-Excel版本从Yahoo获得实时数据和历史数据
http://www.matlabsky.com/thread-22356-1-1.html



2 通达信软件

数据源:通达信软件
数据质量:一般
可获取的数据:股票
说明:
通达信软件这么多年一直是大家获取数据的主要来源之一,获取方式就是通过分析通达信的数据存贮的数据格式,然后通过MATLAB读取通达信软件的数据提取,具体可以参见以下帖子:

从通达信中生成日线与5分钟线数据的时间序列对象
http://www.matlabsky.com/thread-35354-1-1.html

建议编写一个中国股票市场的工具箱,先放上自己的源码
http://www.matlabsky.com/thread-38451-1-1.html

获取自1990年以来两市的节假日(非周末)的程序
http://www.matlabsky.com/thread-36206-1-1.html


3 交易开拓者TB

数据源:TB
数据质量:一般
可获取的数据:期货、股票
说明:
TB支持直接导出数据,可以直接把TB中的数据导出,然后在其他平台进行相关测试。股票数据的话,可能需要老的TB账号才能有,现在可能关闭了股票行情的申请了。具体方式就是安装TB后直接导出数据。


4 数据堂网站
数据源:http://www.datatang.com/
数据质量:未知
可获取的数据:比较杂
说明:





二、数据分享

1 股票

(1)数据名称:#沪深交易所数据_Wind日线(Stock_ETF)[20000101-20140401].rar
数据来源:Wind
数据质量:一般
数据格式:.xls
数据大小:RAR压缩文件1.52G说明:Wind上下载整理的股票日线数据(包括沪深A股数据、ETF数据,不复权、复权数据都有)
数据截图:

数据下载:
http://www.matlabsky.com/thread-42850-1-1.html


2 期货

(1)数据名称:股指期货1分钟主力连续数据(20100601-20130116)IF_main_clean.mat
数据来源:... ...
数据质量:还可以已经清洗过
数据格式:.mat
数据大小:1.97M
说明:
这是我自己平时测试IF时,所用的1分钟数据主力连续数据,有了1分钟的数据,其实周期的数据,您可以自行转换。
主力合约的定义是成交量*持仓量最大,不向后换月,按照这个定义进行的连续数据的生成。
数据截图:
数据题头:日期、时间、开、高、低、收、成交量、持仓量



数据下载:
http://www.matlabsky.com/thread-42850-1-1.html

3 期权



4 外汇



5 其他(天气数据、舆情数据等等)

matlab 批量获取全国各城市实时天气数据函数
http://www.matlabsky.com/thread-38365-1-1.html[有时候天气数据也可能会成为构建模型的因子之一--- faruto按]

通过MATLAB获取中金所每日结算会员成交持仓排名
http://www.matlabsky.com/thread-39817-1-1.html
[持仓数据不用说了非常重要,使用持仓数据构建的模型可能会和单纯使用价格信息构建的模型产生异构 --- faurto按]




























0

阅读 评论 收藏 转载 喜欢 打印举报
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有