注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

江志祥的博客

可恶的中国银行,信用卡像病毒啊,取消那么难,,,

 
 
 

日志

 
 

php编码转换及问题(utf-8, gbk,gb2312)  

2012-09-29 17:08:50|  分类: 计算机-php |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

首先,编码,在大陆,最常见的也就两种,一种是utf-8,一种是gbk/gb2312。

gb2312是简体中文编码。gbk/gb2312是中文编码,二者是相对兼容的。

数据库存储数据,一般采用utf8编码方式。而常常我们windows系统默认的编码方式是gb2312,这就出现了编码不统一的问题。

 

情景:

写入数据库。此时:我们需要将编码改为utf8后,才能往数据库存储。

其实,只需要简单的三步:判断编码,编码转换,写入数据库。(仅提供gbk/gb2312 与 utf8编码之间的转换,其他非主流类似处理即可)

一、判断编码

有很多种方式,我现在用的是这种:

复制代码
function is_utf8($string) {   
return preg_match('%^(?:
[\x09\x0A\x0D\x20-\x7E]
| [\xC2-\xDF][\x80-\xBF]
| \xE0[\xA0-\xBF][\x80-\xBF]
| [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}
| \xED[\x80-\x9F][\x80-\xBF]
| \xF0[\x90-\xBF][\x80-\xBF]{2}
| [\xF1-\xF3][\x80-\xBF]{3}
| \xF4[\x80-\x8F][\x80-\xBF]{2}
)*$%xs', $string);
}
复制代码

这是各种编码的区间:

$re['utf-8']  = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/";
$re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/";
$re['gbk'] = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/";
$re['big5'] = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/";

通过此函数,稍作修改即可:

function is_utf8($string) {
return preg_match('/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/', $string);
}

 

二、编码转换

编码转换一般有三种方式:1、iconv  2、mbstring扩展 3、自写转换函数

2、因为我php开启了mbstring扩展,我使用的是此方式。

//utf-8 to gb2312
$str = mb_convert_encoding("杨森", "gb2312", "utf-8");
//GBK to UTF-8
$str = mb_convert_encoding($str, "utf-8", "GBK");

1、iconv转换

//UTF-8 to GB2312
//UTF-8转换时有小bug,请在第二个参数后加"//IGNORE"

iconv("UTF-8","GB2312//IGNORE",$data)

//GB2312 to UTF-8
iconv('GB2312', 'UTF-8', $str);

3、自写转换函数,我还没自己写过,没有自己的,写上来也是网上查询所得。所以建议网上自行查询。

 

4、如果牵涉到文件上传的编码,可使用以上函数直接读入然后写入即可。

file_get_contents($path);
if(!is_utf8($str)) {
$str = mb_convert_encoding($str, "utf-8", "gbk");
file_put_contents($path, $str);
}

然后就写入数据库了。

  评论这张
 
阅读(311)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017