加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

python:lxml中etree方法获取中文乱码的问题

(2017-06-07 21:04:17)
分类: python
如果响应html文件中存在中文,那么下面的代码运行就会输出乱码
html = etree.HTML(text)
result = etree.tostring(html)
改成以下即可
html = etree.HTML(text)
result = etree.tostring(html,encoding="utf-8",pretty_print=True,method="html")
其中pretty_print是关于输出格式的参数,encoding定义了编码方式

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有