如何实现敏感词词库过滤?
目前有个需求是对文章内容进行敏感词标注并过滤,敏感词词库如果不多的话,可以用一个循环来处理,但是实际使用当中,词库的数据量可能有几万个词。
对于词库数量上完个,而且过滤结果需要标记的,有没有什么第三方库或者其他设计思路推荐?
最终效果就是输入待检测文本,输出命中的关键词词组,并对原文命中词语进行其他颜色的标注!
推荐文章: