Python:使用正则表达式从文本中定位并提取想要的内容
(2020-06-28 09:39:32)分类: 爬虫-文本分析 |
原文链接:https://www.lianxh.cn/news/7c2e4aed24196.html
目录
一、问题提出
还是年报问询函的研究,需要从问询函文本中提取交易所要求回复的日期,同时还需要从公司回复的文本中提取公司实际上回复的日期。因此需要对两类文本分别进行分析。
二、解决思路
通过观察,发现问询函中含有交易所要求回复的日期的句子通常是这样的:
“请你公司就上述问题做出书面说明,并在 8 月 9 日前将有关说明 材料报送我部,并对外披露。”
“请你公司就上述问题做出书面说明,涉及需披露的,请及时履行披露义务,并在2015年5月6日前将有关说明材料报送我部,同时抄送派出机构。”