找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 946|回复: 0
打印 上一主题 下一主题

用php实现gb2312和unicode间的编码转换

[复制链接]

2487

主题

2487

帖子

7391

积分

论坛元老

Rank: 8Rank: 8

积分
7391
跳转到指定楼层
楼主
发表于 2018-2-14 09:47:45 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

            gb2312 和 unicode 间的编码转换
下面的例子是将 gb2312 转换为 "全"这种形式
php4.3.1以后的iconv函数很好用的,只是需要自己写一个uft8到unicode的转换函数
查表(gb2312.txt)也行
[U]复制代码[/U] 代码如下:

unicode
function utf8_unicode($c) {
switch(strlen($c)) {
case 1:
return ord($c);
case 2:
$n = (ord($c[0]) & 0x3f)  

下面的例子是利用php将"全"这中编码转换为gb2312.
[U]复制代码[/U] 代码如下:
>6);
$str.=chr(0x80 | $c & 0x3F);
} else if ($c >12);
$str.=chr(0x80 | $c>>6 & 0x3F);
$str.=chr(0x80 | $c & 0x3F);
} else if ($c >18);
$str.=chr(0x80 | $c>>12 & 0x3F);
$str.=chr(0x80 | $c>>6 & 0x3F);
$str.=chr(0x80 | $c & 0x3F);
}
return iconv('UTF-8', 'GB2312', $str);
}
?>

或者是
[U]复制代码[/U] 代码如下:
function unescape($str) {
$str = rawurldecode($str);
preg_match_all("/(?:%u.{4})|&x.{4};|&\d+;|.+/U",$str,$r);
$ar = $r[0];
print_r($ar);
foreach($ar as $k=>$v) {
if(substr($v,0,2) == "%u")
$ar[$k] = iconv("UCS-2","GB2312",pack("H4",substr($v,-4)));
elseif(substr($v,0,3) == "&x")
$ar[$k] = iconv("UCS-2","GB2312",pack("H4",substr($v,3,-1)));
elseif(substr($v,0,2) == "&#") {
echo substr($v,2,-1)."
";
$ar[$k] = iconv("UCS-2","GB2312",pack("n",substr($v,2,-1)));
}
}
return join("",$ar);
}
$str = "TTL全天候自动聚焦";
echo unescape($str); //out TTL全天候自动聚焦

利用javascript来转换
[U]复制代码[/U] 代码如下:

BODY {
FONT-SIZE: 9pt; PADDING-RIGHT: 0px; PADDING-LEFT: 0px; PADDING-BOTTOM: 0px; PADDING-TOP: 0px;
}
input {
FONT-SIZE: 9pt; height: 13pt;
}


Unicode

文本原型:



转换代码:



正向转换





下面是一个显示所有全角半角的字体的查看例子
[U]复制代码[/U] 代码如下:

BODY {
FONT-SIZE: 9pt; PADDING-RIGHT: 0px; PADDING-LEFT: 0px; PADDING-BOTTOM: 0px; PADDING-TOP: 0px;
}
input {
FONT-SIZE: 9pt; height: 13pt;
}









自定义: -




下面是一个查表(gb2312),转换gb2312到utf8的例子, 现在有iconv函数,这个已经没有太大的意义了,
[U]复制代码[/U] 代码如下:
127) {
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb)-2);
$utf8.=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
}else{
$this=substr($gb,0,1);
$gb=substr($gb,1,strlen($gb)-1);
$utf8.=u2utf8($this);
}
}
return $utf8;
}
function u2utf8($c){
$str="";
if ($c >6);
$str.=chr(0x80 | $c & 0x3F);
} else if ($c >12);
$str.=chr(0x80 | $c>>6 & 0x3F);
$str.=chr(0x80 | $c & 0x3F);
} else if ($c >18);
$str.=chr(0x80 | $c>>12 & 0x3F);
$str.=chr(0x80 | $c>>6 & 0x3F);
$str.=chr(0x80 | $c & 0x3F);
}
return $str;
}
?>
            
            
您可能感兴趣的文章:
  • php utf-8转unicode的函数
  • php UTF-8、Unicode和BOM问题
  • PHP中正则表达式对UNICODE字符码的匹配方法
  • 浅析PHP中的UNICODE 编码与解码
  • php制作unicode解码工具(unicode编码转换器)代码分享
  • PHP解码unicode编码的中文字符代码分享
  • php实现utf-8转unicode函数分享
  • PHP解密Unicode及Escape加密字符串
  • 简单谈谈php中的unicode和utf8编码
  • PHP如何实现Unicode和Utf-8编码相互转换
  • PHP实现Unicode编码相互转换的方法示例
            
  • 分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    用户反馈
    客户端