如何根据某个特征词,在日志里抽取 10 行文本内容
需求:
特征词是:“2019年”,特征词大概有10W个
如何从大量的日志文本里进行抽取 。
我能想到的只有遍历,但效率太低了。
有没有那种使用f.read(),然后正则匹配内容,得到内容是包含特征词的句子
word = 2019
preg = r'(.*)(%s)(.*)\n' % word
res = re.findall(preg,txt)
#这样好像有点low,哈哈
f.read()使用这个方法,还没有遍历执行速度快呢
cat /path/to/file | grep keywords