如何根据某个特征词，在日志里抽取 10 行文本内容

需求：
特征词是：“2019年”，特征词大概有10W个
如何从大量的日志文本里进行抽取。

我能想到的只有遍历，但效率太低了。
有没有那种使用f.read(),然后正则匹配内容，得到内容是包含特征词的句子

word = 2019
preg = r'(.*)(%s)(.*)\n' % word
res = re.findall(preg,txt)
#这样好像有点low，哈哈

附言 1 · 7年前

f.read()使用这个方法，还没有遍历执行速度快呢

最闲的码农

课程读者 291 声望

php @ 你猜

=，

0 人点赞

推荐文章：

更多推荐...

置顶

[进度 100.00%] Python Masonite 4.0 中文翻译召集（Python 中的类 Laravel 框架） 15 / 20 |

博客

2021年python库大全 30 / 5 |

公告

Python Masonite 框架中文翻译召集（Python 中的类 Laravel 框架） 24 / 25 |

博客

收集了一些各大网站 python 的登陆方式,希望对学习 python 的小白，和想写爬虫的你们有所帮助,,本项目用于研究和分享各大网站的模拟登陆方式 17 / 5 |

翻译

Python 3.7 的一些新特性 10 / 2 |

公告

一起学 Python 《Python 最佳实践指南》翻译召集 16 / 2 |

hldh214

78 声望

最佳答案

cat /path/to/file | grep keywords

7年前评论

最闲的码农（楼主）

@hldh214 没事了，解决了，就是我要匹配的是 keywords前面必须是小数和整数 “小数|整数keywords”。

最闲的码农（楼主）

"[\d+.\d+|\d+]两个" ? grep 怎么写这个表达试呢？我刚刚试了一下，写这个表达试，查出来的都是 "+两个"

hldh214 （作者）

@最闲的码农没懂你的意思

讨论数量: 1

hldh214

78 声望

cat /path/to/file | grep keywords

7年前评论

最闲的码农（楼主）

@hldh214 没事了，解决了，就是我要匹配的是 keywords前面必须是小数和整数 “小数|整数keywords”。

最闲的码农（楼主）

"[\d+.\d+|\d+]两个" ? grep 怎么写这个表达试呢？我刚刚试了一下，写这个表达试，查出来的都是 "+两个"

hldh214 （作者）

@最闲的码农没懂你的意思

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

如何根据某个特征词，在日志里抽取 10 行文本内容

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

如何根据某个特征词，在日志里抽取 10 行文本内容

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录