python:lxml中etree方法获取中文乱码的问题
(2017-06-07 21:04:17)| 分类: python |
如果响应html文件中存在中文,那么下面的代码运行就会输出乱码
html
=
etree.HTML(text)
result
=
etree.tostring(html)
改成以下即可
html
=
etree.HTML(text)
result
=
etree.tostring(html,encoding="utf-8",pretty_print=True,method="html")
其中pretty_print是关于输出格式的参数,encoding定义了编码方式

加载中…