在php中如果你想正則來獲取字符串中漢字我們先需要知道頁面編碼,正則匹配中文漢字根據頁面編碼不同而略有區別:GBK/GB2312編碼:[x80-xff>]+ 或 [xa1-xff]+ 而UTF-8編碼:[x{4e00}-x{9fa5}]+/u 。
例
代碼如下 復制代碼echo (mb_eregi("[x80-xff].","中d文") ? "有" : "無") ."漢字";
echo (mb_eregi("^([x80-xff].)+$","中文") ? "全是漢字" : ""); 看一判斷全中文字符串函數
以下以PHP為例進行匹配:
代碼如下 復制代碼<?php
$str = "學習php是一件快樂的事。";
preg_match_all("/[x80-xff]+/", $str, $match);
//UTF-8 使用:
//preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match);
print_r($match);
?>
輸出:
Array
(
[0] => Array
(
[0] => 學習
[1] => 是一件快樂的事。
)
)
正則漢字
代碼如下 復制代碼$str = "請問php中的eregi如何匹配漢字";
if (preg_match("/^[".chr(0x80)."-".chr(0xff)."]+$/",$str)) {
echo "這是一個純中文字符串";
} else{
echo "這不是一個純中文字串";
}
preg_match_all($pat,……)與preg_replace($pat,……)……
preg_match_all("/(漢字)+/ism","我是漢字,看你把我怎麼著!",$m_a);
了各個編碼的高位與低位的開始與結束,那麼自然就可以寫出正則,而且直接是十六位的,有啥困難?呵呵。不過要注意,在php裡面,表示十六位是用的x
我們還可以用該正則表達式來判斷是否是gb2312的漢字
<?php
$str = "小小子";
if(preg_match("/^[xb0-xf7][xa0-xfe]+$/",$str)){
print($str."確實全是漢字");
} else {
print($str."這個真tc不全是漢字");
}
?>