问下如何一个评论功能,加上违禁词 查找功能?
情况是这样的,
我这边做一个类似论坛的功能,发帖的人很多,现在想先对这些帖子进行违禁词查找,如何查到有违禁词就先不让他发布出来,转回给用户,
不知大家都怎么做这功能?
这种找接口吧,阿里云就有
docs.fresns.cn/database/contents/b...
正好我的系统里有这个功能,免费开源的,你可以学习一下源码实现。
但是如果词太多,还是用第三方云服务,不然每篇内容都跑一遍词,服务器性能要求太高了。
这个应该就是违禁词过滤吧
之前是使用的三方开源包搞的,有性能瓶颈
还是使用第三方的服务比较好使
AC自动机
楼上说的都没啥问题了,不过一般需要接入审核的可以两步走,如果所有的用户都需要审核可以先加一个待审核的状态,异步去做这个事情,然后这个异步队列专门处理就好。至于自己实现内容判断,还是掉三方接口就看个人喜好了。“av” => "java" 🐶
违禁词功能好做,主要是词库没有第三方的丰富,如果有大量用户,还是用第三方的比较好,对比看下哪个性价比高用哪个
如果不用第三方服务,自己做的话,用这个查询,几万词,千字文匹配,速度还行
查询前根据实际情况,先去除标签,换行符,甚至标点符号
使用腾讯或者百度的第三方接口吧
微信有这个接口
刚好那天看到一篇文章,可以看看这个:
laravel 框架实现敏感词汇过滤功能