程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> php簡簡單單搞定中英文混排字符串截取,只需2行代碼!

php簡簡單單搞定中英文混排字符串截取,只需2行代碼!

編輯:關於PHP編程

提到中英文混排計數、截取,大家首先想到的是ascii、16進制、正則匹配、循環計數。

今天我給大家分享的是php的mb擴展,教你如何輕松處理字符串。


 

先給大家介紹用到的函數:

mb_strwidth($str, $encoding) 返回字符串的寬度

$str 要計算的字符串

$encoding 要使用的編碼,如 utf8、gbk

mb_strimwidth($str, $start, $width, $tail, $encoding) 按寬度截取字符串

$str 要截取的字符串

$start 從哪個位置開始截取,默認是0

$width 要截取的寬度

$tail 追加到截取字符串後邊的字符串,常用的是 ...

$encoding 要使用的編碼


 

下邊給大家實例演示:

<?php
/**
 * utf8 編碼格式
 * 1個中文占用3個字節
 * 我們希望的是1個中文占用2個字節,
 * 因為從寬度上看2個英文字母占用的位置相當於1個中文
 */

// 測試字符串
$str = 'aaaa啊啊aaaa啊啊啊aaa';
echo strlen($str); // 只用strlen輸出為25個字節

// 必須指定編碼,不然會使用php的內碼 mb_internal_encoding()可以查看內碼
// 使用mb_strwidth輸出字符串的寬度為20使用utf8編碼
echo mb_strwidth($str, 'utf8'); 

// 只有寬度大於10才截取
if(mb_strwidth($str, 'utf8')>10){
    // 此處設定從0開始截取,取10個追加...,使用utf8編碼
    // 注意追加的...也會被計算到長度之內
    $str = mb_strimwidth($str, 0, 10, '...', 'utf8');
}

// 最後輸出 aaaa啊... 4個a算4個 1個啊算2個 3個點算3個 4+2+3=9
// 是不是很簡單啊,有的人說了為什麼是9個不是10個嗎?
// 因為正好“啊”的後邊還是“啊”,中文算2個,9+2=11 超出了設定,所以去掉1個就是9了
echo $str;

 


 

下邊再給大家介紹一些其它函數吧:

mb_strlen($str, $encoding) 返回字符串的長度

$str 要計算的字符串

$encoding 使用的編碼

mb_substr($str, $start, $length, $encoding) 截取字符串

$str 要截取的字符串

$start 從哪裡開始截取

$length 截取多長

$encoding 使用的編碼

其實這2個函數和strlen()、substr()很像,唯一的不同就是可以設定編碼。


 

下邊上實例:

<?php
/**
 * utf8 編碼格式
 * 1個中文占用3個字節
 */
$str = 'aa12啊aa';
echo strlen($str); // 直接輸出長度為9

// 輸出長度為7,為什麼是7呢?
// 注意這裡設定編碼以後,不管是中文還是英文每個長度都為1
// a a 1 2 啊 a a 
// 1+1+1+1+1+1+1 = 7
// 是不是正好7個字符啊
echo mb_strlen($str, 'utf8');

// 同樣mb_substr也是一樣的
// 我現在只想要5個字符
echo mb_substr($str, 0, 5, 'utf8'); // 輸出 aa12啊

 


 

其實mb擴展裡邊很有很多好用的函數,這裡就不給大家一一列舉。

有興趣的朋友可以查看官方手冊

http://www.php.net/manual/zh/ref.mbstring.php

好了,今天就先介紹到這裡了。

 

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved