加载中…
个人资料
新技术笔记
新技术笔记
  • 博客等级:
  • 博客积分:0
  • 博客访问:403,353
  • 关注人气:197
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
正文 字体大小:

Python网页解析器BeautifulSoup的说明

(2014-08-19 16:52:12)
标签:

杂谈

分类: 技术荟萃

BeautifulSoup是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树。通常用来分析爬虫抓取的web文档。对于不规则的Html文档,也有很多的补全功能,节省了开发者的时间和精力。

1 BeautifulSoup安装

方法一:下载安装

安装BeautifulSoup很简单,下载BeautifulSoup源码。解压运行python setup.py install。

测试安装是否成功。键入import BeautifulSoup如果没有异常,即成功安装

方法二:easy-install BeautifulSoup;需要先安装了setuptools: sudo apt-get install python-setuptools

方法三:在ubuntu上,sudo apt-get install python-BeautifulSoup

2 在线文档

Beautiful Soup 的官方文档齐全,将官方给出的例子实践一遍就能掌握。官方英文文档中文文档

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有