Python3.4爬虫下载火币网比特币历史交易记录

标签:
it股票杂谈 |
分类: 程序 |
不知不觉中,我在火币网的历史成交记录已经有上千页了,最近想下载下来分析分析,一页一页的复制粘贴显然不现实,最近正好在学习python,于是拿来练练手,参考网上的例子,写了个python爬虫,达到了想要的结果。类似的下载莱特币记录,以及OKcoin的数据,稍微改动一下应该就可以了。我去,正则部分的表达式显示出错,就粘贴图片吧。
import
gzip
import
re
import
http.cookiejar
import
urllib.request
import
urllib.parse
import
string
import
os
#下面几条是处理cookie的
cj =
http.cookiejar.CookieJar()
pro =
urllib.request.HTTPCookieProcessor(cj)
opener
= urllib.request.build_opener(pro)
#火币的网页是压缩的,要解压
def
ungzip(data):
#处理一下报头,伪装浏览器
def
getOpener(head):
header
= {
}
url =
'https://www.huobi.com/account/login.php' #火币的登陆页
opener
= getOpener(header)
postDict = {
}
postData =
urllib.parse.urlencode(postDict).encode()
op2 =
opener.open(url, postData) #先登录
f=open(r'C:/python34/火币历史交易数据.txt','w',encoding='utf-8')
#数据文件保存的位置
for i in
range(1,100):
#要下载的页数自己改
f.close()
print('保存完成')