如何根据某个特征词,在日志里抽取 10 行文本内容

需求:
特征词是:“2019年”,特征词大概有10W个
如何从大量的日志文本里进行抽取 。

我能想到的只有遍历,但效率太低了。
有没有那种使用f.read(),然后正则匹配内容,得到内容是包含特征词的句子

word = 2019
preg = r'(.*)(%s)(.*)\n' % word
res = re.findall(preg,txt)
#这样好像有点low,哈哈
附言 1  ·  4年前

f.read()使用这个方法,还没有遍历执行速度快呢

最佳答案

cat /path/to/file | grep keywords

4年前 评论
最闲的码农 (楼主) 4年前
最闲的码农 (楼主) 4年前
hldh214 (作者) 4年前
讨论数量: 1

cat /path/to/file | grep keywords

4年前 评论
最闲的码农 (楼主) 4年前
最闲的码农 (楼主) 4年前
hldh214 (作者) 4年前

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!