Python 机器学习记录(1)——爬虫获取互联网文本,获取Facebook Comments
(2017-05-10 12:50:33)
标签:
python爬虫数据挖掘 |
分类: python爬虫 |
开始学习记录
NormalText
Code
首先分析facebook给出的数据
如下面数据
|
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 |
#
"""
Created
"""
#import
import
import
import
import
headers
}
s
#s.proxies
login_data
#
s.post('https://www.facebook.com/',headers=headers,
token
#设置获取hotlink的feed,设置时间逆序order=reverse_chronological,选择多层commet,设置offset,设置限制读取post数
url
limitstr='&limit='
tokenstr='&access_token='
totalnum=100000
limit=20
Posts_list
Comments_list=[]
for
#
#
#
dfp
dfc
dfp.to_csv("自己保存的位置hotlinkfacebookposts.csv")
dfc.to_csv("自己保存的位置hotlinkfacebookcomments.csv")
|

加载中…