加载中…
个人资料
Stata连享会
Stata连享会
  • 博客等级:
  • 博客积分:0
  • 博客访问:37,804
  • 关注人气:21
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Python:使用正则表达式从文本中定位并提取想要的内容

(2020-06-28 09:39:32)
分类: 爬虫-文本分析
原文链接:https://www.lianxh.cn/news/7c2e4aed24196.html

目录

 

 


一、问题提出

还是年报问询函的研究,需要从问询函文本中提取交易所要求回复的日期,同时还需要从公司回复的文本中提取公司实际上回复的日期。因此需要对两类文本分别进行分析。

二、解决思路

通过观察,发现问询函中含有交易所要求回复的日期的句子通常是这样的:

“请你公司就上述问题做出书面说明,并在 8 月 9 日前将有关说明 材料报送我部,并对外披露。”
“请你公司就上述问题做出书面说明,涉及需披露的,请及时履行披露义务,并在2015年5月6日前将有关说明材料报送我部,同时抄送派出机构。”


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有