|
在php中字符編碼轉(zhuǎn)換我們一般會(huì)用到iconv與mb_convert_encoding進(jìn)行操作,但是mb_convert_encoding在轉(zhuǎn)換性能上比iconv要差很多哦。
string iconv ( string in_charset, string out_charset, string str ) 注意:第二個(gè)參數(shù),除了可以指定要轉(zhuǎn)化到的編碼以外,還可以增加兩個(gè)后綴://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 會(huì)自動(dòng)將不能直接轉(zhuǎn)化的字符變成一個(gè)或多個(gè)近似的字符,//IGNORE 會(huì)忽略掉不能轉(zhuǎn)化的字符,而默認(rèn)效果是從第一個(gè)非法字符截?cái)唷?
Returns the converted string or FALSE on failure.
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 擴(kuò)展庫,在 php.ini里將; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多種輸入編碼,它會(huì)根據(jù)內(nèi)容自動(dòng)識別,但是執(zhí)行效率比iconv差太多;
使用:
發(fā)現(xiàn)iconv在轉(zhuǎn)換字符”―”到gb2312時(shí)會(huì)出錯(cuò),如果沒有ignore參數(shù),所有該字符后面的字符串都無法被保存。不管怎么樣,這個(gè)”―”都無法轉(zhuǎn)換成功,無法輸出。 另外mb_convert_encoding沒有這個(gè)bug.
一般情況下用 iconv,只有當(dāng)遇到無法確定原編碼是何種編碼,或者iconv轉(zhuǎn)化后無法正常顯示時(shí)才用mb_convert_encoding 函數(shù).
復(fù)制代碼 代碼如下:
/**
*自動(dòng)判斷把gbk或gb2312編碼的字符串轉(zhuǎn)為utf8
*能自動(dòng)判斷輸入字符串的編碼類,如果本身是utf-8就不用轉(zhuǎn)換,否則就轉(zhuǎn)換為utf-8的字符串
*支持的字符編碼類型是:utf-8,gbk,gb2312
*@$str:string 字符串
*/
function yang_gbk2utf8($str){
$charset = mb_detect_encoding()($str,array('UTF-8','GBK','GB2312'));
$charset = strtolower($charset);
if('cp936' == $charset){
$charset='GBK';
}
if("utf-8" != $charset){
$str = iconv($charset,"UTF-8//IGNORE",$str);
}
return $str;
}
下面我接著看在轉(zhuǎn)換字符編碼的一些問題
用mb_detect_encoding($str);函數(shù),使用該函數(shù)必須打開php的extension=php_mbstring.dll擴(kuò)展
復(fù)制代碼 代碼如下:
<?php
$str="測試ing";
$cha=mb_detect_encoding($str);
$s = iconv($cha,"UTF-8",$str);
var_dump($s);
?>
結(jié)果返回:
string(0) “”
真是奇怪,為什么會(huì)這樣。
復(fù)制代碼 代碼如下:
<?php
$str="測試ing";
$cha=mb_detect_encoding($str);
$s = iconv("GB2312","UTF-8",$str);
var_dump($s);
?>
返回結(jié)果正確。發(fā)現(xiàn)該函數(shù)mb_detect_encoding($str);判斷還是不準(zhǔn)確。不知是什么原因。
函數(shù)string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )
可以轉(zhuǎn)換為指定編碼的字符串,我寫了例子
復(fù)制代碼 代碼如下:
<pre lang="php" line="1">
<?php
$a="我很好";
echo mb_convert_encoding ($a,'UTF-8');
?>
可結(jié)果是:
??潞?潞?
現(xiàn)在的問題就是我如果把不同的字符串編碼形式統(tǒng)一轉(zhuǎn)換為utf-8,如果事先知道改變嗎可以用iconv,但如果不知道該編碼該怎么辦呢?
問題3:iconv問題,如果轉(zhuǎn)換的字符串,第一個(gè)字節(jié)的編碼大于一定的數(shù)會(huì)返回空.
如:
復(fù)制代碼 代碼如下:
<?php
$str=chr(254)."測試ing".chr(254);
$s = iconv("GB2312","UTF-8",$str);
var_dump($s);
?>
返回
string(0) “”
mb_convert_encoding的用法見官方:
http://cn.php.NET/manual/en/function.mb-convert-encoding.php
php中的另外一個(gè)函數(shù)iconv也是用來轉(zhuǎn)換字符串編碼的,與上函數(shù)功能相似。
下面還有一些詳細(xì)的例子:
iconv ― Convert string to requested character encoding
(php 4 >= 4.0.5, php 5)
mb_convert_encoding ― Convert character encoding
(php 4 >= 4.0.6, php 5)
用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 擴(kuò)展庫,在 php.ini里將; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多種輸入編碼,它會(huì)根據(jù)內(nèi)容自動(dòng)識別,但是執(zhí)行效率比iconv差太多;
string iconv ( string in_charset, string out_charset, string str )
注意:第二個(gè)參數(shù),除了可以指定要轉(zhuǎn)化到的編碼以外,還可以增加兩個(gè)后綴://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 會(huì)自動(dòng)將不能直接轉(zhuǎn)化的字符變成一個(gè)或多個(gè)近似的字符,//IGNORE 會(huì)忽略掉不能轉(zhuǎn)化的字符,而默認(rèn)效果是從第一個(gè)非法字符截?cái)唷?BR>Returns the converted string or FALSE on failure.
使用:
發(fā)現(xiàn)iconv在轉(zhuǎn)換字符”―”到gb2312時(shí)會(huì)出錯(cuò),如果沒有ignore參數(shù),所有該字符后面的字符串都無法被保存。不管怎么樣,這個(gè)”―”都無法轉(zhuǎn)換成功,無法輸出。 另外mb_convert_encoding沒有這個(gè)bug.
一般情況下用 iconv,只有當(dāng)遇到無法確定原編碼是何種編碼,或者iconv轉(zhuǎn)化后無法正常顯示時(shí)才用mb_convert_encoding 函數(shù).
from_encoding is specified by character code name before conversion. it can be array or string
主站蜘蛛池模板:
日p视频免费看
|
羞羞羞视频
|
蜜桃精品噜噜噜成人av
|
91精品久久久久久久99
|
久久lu
|
免费高潮视频95在线观看网站
|
国产一区二区三区
|
女人夜夜春
|
国产精品久久久久久久久图文区
|
男女羞羞视频网站
|
国产1区2区3区
|
激情三区
|
成人国产精品入口免费视频
|
人人射人人|
精品久久久久久红码专区
|
a久久久久久
|
成人精品一区
|
欧美成人一级
|
a久久
|
久草在线在线精品观看
|
国产激情在线观看
|
日韩国产欧美在线观看
|
日本欧美在线
|
亚洲精品美女在线观看
|
超碰av在线
|
日韩欧美国产一区二区三区
|
草久久
|
日韩精品在线一区
|
99爱在线免费观看
|
久久国内精品
|
韩日三级|
亚洲日韩中文字幕一区
|
羞羞视频免费观
|
黄色网址在线播放
|
91色综合|
伊人春色在线
|
乱码av午夜噜噜噜噜动漫
|
色欧美片视频在线观看
|
国产成人网
|
久久综合爱
|
亚洲精品中文字幕av
|