找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 538|回复: 0
打印 上一主题 下一主题

PHP实现通过中文字符比率来判断垃圾评论的方法

[复制链接]

2500

主题

2513

帖子

7520

积分

论坛元老

Rank: 8Rank: 8

积分
7520
跳转到指定楼层
楼主
发表于 2018-2-14 05:53:57 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

            本文实例讲述了PHP实现通过中文字符比率来判断垃圾评论的方法。分享给大家供大家参考。具体实现方法如下:
一、需求:
最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包含啥中文的敏感词,所以就堂而皇之的通过了评论过滤。对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判。
二、解决方案:
要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1。同一段字符通过两个函数取得的长度之差就是实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率。
三、实现代码:
[U]复制代码[/U] 代码如下: $len_all = strlen($comment['text']);                     
$len_st = mb_strlen($comment['text'], 'UTF-8');
if(($len_all-$len_st)/(2*$len_st)
如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断。
希望本文所述对大家的PHP程序设计有所帮助。
            
            
您可能感兴趣的文章:
  • php中使用Akismet防止垃圾评论的代码
  • PHP用strstr()函数阻止垃圾评论(通过判断a标记)
  • ThinkPHP上使用多说评论插件的方法
  • 使用AngularJS和PHP的Laravel实现单页评论的方法
  • PHP结合jQuery实现的评论顶、踩功能
  • 修改PHP脚本使WordPress拦截垃圾评论的方法示例
  • 编写PHP脚本来实现WordPress中评论分页的功能
  • 讲解WordPress中用于获取评论模板和搜索表单的PHP函数
  • 详解WordPress中调用评论模板和循环输出评论的PHP函数
  • 在PHP站点的页面上添加Facebook评论插件的实例教程
            
  • 分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    用户反馈
    客户端