查看: 87|回复: 0

Discuz高性能词语过滤 V2.4(god_mgc)

[复制链接]

3992

主题

353

回帖

4482

积分

论坛元老

积分
4482
发表于 2024-4-28 11:29:05 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
高性能词过滤插件,9000字帖子内容匹配 五十万关键词仅需0.5秒(开启opcache缓存后仅需0.15秒);在高数据量下比系统自带的词语过滤功能性能提高20-200倍(关键词数量越多,差距就越明显)。

不依赖任何云服务,纯php算法(DFA)实现。

支持 论坛/群组的发帖回帖、论坛私信过滤、用户资料页填写内容过滤。


不仅可以过滤不文明词语,配置好词库可以过滤90%广告内容。

使用方法:下载插件的常用屏蔽字符资料,根据自己的需要把相关的关键词和字符添加到插件后台的“添加词语”框,然后点插件的更新缓存,会提示生成的缓存文件大小,正常情况会返回大于 1KB。


(因为总所周知的原因,有大部分关键词不能提供,本人有 网易/微信/豆瓣等各大平台的一部分敏感词库,已经人工清洗一遍词库内容,去掉很多常用的关键词,防止误报,所有词库数据在15W个词左右,有需要可以找我,不免费。)

可以免费提供互联网上流传的词库,但是那些词库太久远了,内容没有清洗,有些词语在现在是正常的内容。

若添加的关键词总数在30W以上,请把php  脚本内存限制修改成 memory_limit 512M 以上。

具体功能和效果可看后面的图片:(对比是和系统自带的词语过滤功能)

合作伙伴测试网站:敏感词测试帖子
账号:测试123
密码:@@ceshi123*+1S

注意:为了不影响线上网站,请在上面的测试帖子内进行回复测试。









------------------------------------------------------------------------
下载地址

免责声明

1.本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
2.如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。

上一篇:Discuz帖子内容字数统计 1.1(god_post_wordnumber)
下一篇:Discuz凹凸曼百度推送 组件版2.3.0(apoyl_baiduxiong)

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表