找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 810|回复: 0
打印 上一主题 下一主题

php5.4以上版本GBK编码下htmlspecialchars输出为空问题解决方法汇总

[复制链接]

2536

主题

2536

帖子

7532

积分

论坛元老

Rank: 8Rank: 8

积分
7532
跳转到指定楼层
楼主
发表于 2018-2-14 05:47:14 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

            从旧版升级到php5.4,恐怕最麻烦的就是htmlspecialchars这个问题了!当然,htmlentities也会受影响,不过,对于中文站来说一般用htmlspecialchars比较常见,htmlentities非常少用到。
可能老外认为网页普遍应该是utf-8编码的,于是苦了那些用GB2312,GBK编码的中文站......!
具体表现:
[U]复制代码[/U] 代码如下:
$str = "9enjoy.com的php版本是5.2.10";
echo htmlspecialchars($str);
gbk字符集下输出为空...utf-8下,输出正常。
为什么呢,原因在于5.4.0对这个函数的变化:
[U]复制代码[/U] 代码如下:
5.4.0   The default value for the encoding parameter was changed to UTF-8.
原来是什么呢?
[U]复制代码[/U] 代码如下:
string htmlspecialchars ( string $string [, int $flags = ENT_COMPAT | ENT_HTML401 [, string $encoding = 'UTF-8' [, bool $double_encode = true ]]] )
Defines encoding used in conversion. If omitted, the default value for this argument is ISO-8859-1 in versions of PHP prior to 5.4.0, and UTF-8 from PHP 5.4.0 onwards.
原来是ISO-8859-1,5.4后默认变成utf-8!然后中文使用这个函数就输出为空白了。
国内一堆开源程序在5.4下都会有这样的问题,DISCUZ官方也建议用户不要升级到5.4
解决方案:
1.苦逼的修改所有用到htmlspecialchars地方的程序
1.1 其第二个$flags参数,默认是ENT_COMPAT,因此改成
[U]复制代码[/U] 代码如下:
htmlspecialchars($str,ENT_COMPAT,'GB2312');
为什么不是GBK?因为没有GBK这个参数,如果强行使用GBK,则报错给你看:
[U]复制代码[/U] 代码如下:
Warning: htmlspecialchars(): charset `gbk' not supported, assuming utf-8
为了能使用GBK,则改成:
[U]复制代码[/U] 代码如下:
htmlspecialchars($str,ENT_COMPAT,'ISO-8859-1');
1.2.一样是改程序,但可以省略一个参数。
可以在网页头部加
[U]复制代码[/U] 代码如下:
ini_set('default_charset','gbk');
然后改成
[U]复制代码[/U] 代码如下:
htmlspecialchars($str,ENT_COMPAT,'');
文档中有写:An empty string activates detection from script encoding (Zend multibyte), default_charset and current locale (see nl_langinfo() and setlocale()), in this order. Not recommended.
大概意思就是:传入空字符串则使用default_charset的编码
1.3.封装一个函数吧...本来htmlspecialchars这个单词一直不好记。
[U]复制代码[/U] 代码如下:
function htmlout($str) {
    return htmlspecialchars($str,ENT_COMPAT,'ISO-8859-1');
}
然后去批量替换。
2.直接修改源码,重编译!这也是目前我在线上做的方案。
修改ext/standard/html.c
大概在372行
[U]复制代码[/U] 代码如下:
/* Default is now UTF-8 */
if (charset_hint == NULL)
return cs_utf_8;
把cs_utf_8改成 cs_8859_1
[U]复制代码[/U] 代码如下:
/* Default is now UTF-8 */
if (charset_hint == NULL)
return cs_8859_1;
编译后,原程序就不用做任何调整了。
安装方法可参考:http://www.jb51.net/article/63388.htm
windows下怎么办?这个,自己想办法编译吧,难度比较大...
提供一个网址供参考:http://www.jb51.net/article/63391.htm
引用其一句话:准备好咖啡、可乐,做好准备,可能要折腾数小时…
            
            
您可能感兴趣的文章:
  • php htmlentities和htmlspecialchars 的区别
  • php 字符过滤类,用于过滤各类用户输入的数据
  • php htmlspecialchars加强版
  • php HtmlReplace输入过滤安全函数
  • PHP开发不能违背的安全规则 过滤用户输入
  • php 对输入信息的进行安全过滤的函数代码
  • php htmlspecialchars()与shtmlspecialchars()函数的深入分析
  • php 去除html标记--strip_tags与htmlspecialchars的区别详解
  • php中filter函数验证、过滤用户输入的数据
  • PHP关于htmlspecialchars、strip_tags、addslashes的解释
  • php htmlentities()函数的定义和用法
  • php过滤输入操作之htmlentities与htmlspecialchars用法分析
            
  • 分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    用户反馈
    客户端