郭振杰-Python网络爬虫与数据处理_助力讲师团文文18632190813

http://blog.sina.com.cn/u/3063217555

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

郭振杰-Python网络爬虫与数据处理

(2022-10-24 08:45:41)

标签：

郭振杰

python网络爬虫

金融数字化

银行数字化转型

分类：互联网

【课程背景】

Python语言是当前最火的语言之一，易于使用，学习曲线低。Python具备丰富成熟的网络库和数据处理库，可以快速的进行网络信息爬取、数据初步处理，并可以应对复杂的网络环境、网站环境。本课程系统讲述Python的网页内容获取库、网页结构和相关协议、HTML内容解析、异步处理以及复杂网络环境数据获取工具。通过本课程，可以初步掌握使用Python进行网络信息爬取的能力。课程结合案例和练习，注重知识的掌握和使用，重点培养学员的实操能力。

【课程收益】

培训完结后，学员能够：

² 了解网页结构和相关协议

² 掌握Python网页内容获取库

² 掌握Python网页内容解析方法

² 掌握常用爬虫库

【课程对象】想学习Python爬虫编程，并具备Python基础编程能力人员

【课程时长】4天 (6小时/天）

【课程大纲】

单元	大纲	内容
单元一	绪论	1. 爬虫介绍 2. 爬虫应用 3. 爬虫技术介绍
单元二	Python简单爬虫开发	1. 使用Python获取网页源代码 2. 多线程爬虫 3. 爬虫常见搜索算法 4. 阶段练习：百度页面爬取
单元三	高性能html解析	1. HTML介绍 2. XPATH介绍和使用 3. Beautiful Soup4介绍和使用 4. 阶段练习：招聘信息爬取
单元四	异步加载和请求	1. HTTP协议简介 2. 网页结构简介 3. Ajax简介 4. 异步加载 5. 伪造请求头 6. 阶段练习：获取视频网站评论
单元五	模拟登陆与验证码	1. 网站登录原理介绍 2. 模拟登陆 3. 验证码机制 4. 验证码处理 5. 阶段练习：模拟网站登录操作
单元六	抓包与中间人爬虫	1. 网络数据传输介绍 2. 数据抓包 3. App和小程序爬虫 4. 中间人爬虫：mitmproxy 5. 阶段练习：小程序内容爬取
单元七	Scrapy爬虫框架	1. Scrapy介绍与安装 2. Scrapy的使用 3. Scrapy与数据库 4. Scrapy与Redis 5. Scrapy中间件 6. Scrapy爬虫部署
单元八	整体练习	根据实际情况设定一个实验课题

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：郭振杰《商业银行数字化》

后一篇：郭振杰《农业地区如何做数字化转型》

新浪BLOG意见反馈留言板　欢迎批评指正