php5.4以上版本GBK编码下htmlspecialchars输出为空问题解决方法汇总

 更新时间:2015年04月03日 09:36:09   投稿:junjie  
这篇文章主要介绍了php5.4以上版本GBK编码下htmlspecialchars输出为空问题解决方法汇总,本文给出多种解决这个问题的方法,需要的朋友可以参考下

从旧版升级到php5.4,恐怕最麻烦的就是htmlspecialchars这个问题了!当然,htmlentities也会受影响,不过,对于中文站来说一般用htmlspecialchars比较常见,htmlentities非常少用到。

可能老外认为网页普遍应该是utf-8编码的,于是苦了那些用GB2312,GBK编码的中文站......!

具体表现:

复制代码 代码如下:

$str = "9enjoy.com的php版本是5.2.10";
echo htmlspecialchars($str);

gbk字符集下输出为空...utf-8下,输出正常。

为什么呢,原因在于5.4.0对这个函数的变化:

复制代码 代码如下:

5.4.0   The default value for the encoding parameter was changed to UTF-8.

原来是什么呢?
复制代码 代码如下:

string htmlspecialchars ( string $string [, int $flags = ENT_COMPAT | ENT_HTML401 [, string $encoding = 'UTF-8' [, bool $double_encode = true ]]] )

Defines encoding used in conversion. If omitted, the default value for this argument is ISO-8859-1 in versions of PHP prior to 5.4.0, and UTF-8 from PHP 5.4.0 onwards.


原来是ISO-8859-1,5.4后默认变成utf-8!然后中文使用这个函数就输出为空白了。

国内一堆开源程序在5.4下都会有这样的问题,DISCUZ官方也建议用户不要升级到5.4

解决方案:

1.苦逼的修改所有用到htmlspecialchars地方的程序

1.1 其第二个$flags参数,默认是ENT_COMPAT,因此改成

复制代码 代码如下:

htmlspecialchars($str,ENT_COMPAT,'GB2312');

为什么不是GBK?因为没有GBK这个参数,如果强行使用GBK,则报错给你看:
复制代码 代码如下:

Warning: htmlspecialchars(): charset `gbk' not supported, assuming utf-8

为了能使用GBK,则改成:
复制代码 代码如下:

htmlspecialchars($str,ENT_COMPAT,'ISO-8859-1');

1.2.一样是改程序,但可以省略一个参数。
可以在网页头部加
复制代码 代码如下:

ini_set('default_charset','gbk');

然后改成
复制代码 代码如下:

htmlspecialchars($str,ENT_COMPAT,'');

文档中有写:An empty string activates detection from script encoding (Zend multibyte), default_charset and current locale (see nl_langinfo() and setlocale()), in this order. Not recommended.
大概意思就是:传入空字符串则使用default_charset的编码

1.3.封装一个函数吧...本来htmlspecialchars这个单词一直不好记。

复制代码 代码如下:

function htmlout($str) {
    return htmlspecialchars($str,ENT_COMPAT,'ISO-8859-1');
}

然后去批量替换。

2.直接修改源码,重编译!这也是目前我在线上做的方案。
修改ext/standard/html.c
大概在372行

复制代码 代码如下:

/* Default is now UTF-8 */
if (charset_hint == NULL)
return cs_utf_8;

把cs_utf_8改成 cs_8859_1
复制代码 代码如下:

/* Default is now UTF-8 */
if (charset_hint == NULL)
return cs_8859_1;

编译后,原程序就不用做任何调整了。
安装方法可参考:https://www.jb51.net/article/63388.htm

windows下怎么办?这个,自己想办法编译吧,难度比较大...
提供一个网址供参考:https://www.jb51.net/article/63391.htm
引用其一句话:准备好咖啡、可乐,做好准备,可能要折腾数小时…

相关文章

  • 解析Win7 XAMPP apache无法启动的问题

    解析Win7 XAMPP apache无法启动的问题

    本篇文章是对Win7 XAMPP apache无法启动的问题进行了详细的分析介绍,需要的朋友参考下
    2013-06-06
  • redis 队列操作的例子(php)

    redis 队列操作的例子(php)

    Reids是一个比较高级的开源key-value存储系统,采用ANSI C实现。其与memcached类似,但是支持持久化数据存储
    2012-04-04
  • 实例探索PHP只读属性改变游戏规则的特性

    实例探索PHP只读属性改变游戏规则的特性

    这篇文章主要为大家介绍了PHP只读属性改变游戏规则的特性实例探索,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2024-01-01
  • PHP实现获取MySQL数据库的记录数据

    PHP实现获取MySQL数据库的记录数据

    如果后台数据处理使用PHP来进行,那么就要有相应的数据处理及返回。最常用的就是获取记录总数和表记录查询结果。本文将为大家介绍如何利用PHP实现获取MySQL数据库的记录数据,需要的可以参考一下
    2022-02-02
  • 分享一个漂亮的php验证码类

    分享一个漂亮的php验证码类

    这篇文章主要为大家分享了一个漂亮的php验证码类,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2016-09-09
  • php下使用strpos需要注意 === 运算符

    php下使用strpos需要注意 === 运算符

    首先应该知道 strpos 函数可能返回布尔值 FALSE,但也可能返回一个与 FALSE 等值的非布尔值,例如 0 或者""。我们应使用 === 运算符来测试本函数的返回值。
    2010-07-07
  • 让Json更懂中文(JSON_UNESCAPED_UNICODE)

    让Json更懂中文(JSON_UNESCAPED_UNICODE)

    我们知道, 用PHP的json_encode来处理中文的时候, 中文都会被编码, 变成不可读的, 类似”\u***”的格式, 还会在一定程度上增加传输的数据量.
    2011-10-10
  • PHP生成不重复标识符的方法

    PHP生成不重复标识符的方法

    这篇文章主要介绍了PHP生成不重复标识符的方法,涉及时间函数time的md5转换,uniqid()函数及GUID的应用,非常具有实用价值,需要的朋友可以参考下
    2014-11-11
  • PHP调用Linux命令权限不足问题解决方法

    PHP调用Linux命令权限不足问题解决方法

    这篇文章主要介绍了PHP调用Linux命令权限不足问题解决方法,本文是解决项目问题总结而来,通过修改sudo配置文件解决无权限执行命令问题,需要的朋友可以参考下
    2015-02-02
  • 用mysql触发器自动更新memcache的实现代码

    用mysql触发器自动更新memcache的实现代码

    不错的一篇文章,用于项目中可以带来更多的便利,按照方法已经调试成功,可以大大提高项目的速度。
    2009-10-10

最新评论