字符:
字符是可使用多種不同字符方案或代碼頁來表示的抽象實體。例如,Unicode UTF-16 編碼將字符表示為 16 位整數序列,而 Unicode UTF-8 編碼則將相同的字符表示為 8 位字節序列。公共語言運行庫使用 Unicode UTF-16(Unicode 轉換格式,16 位編碼形式)表示字符。
php在UTF-8編碼下,一個漢字占3個字符,gbk編碼下只占2個字符。
字節(Byte):
字節是通過網絡傳輸信息(或在硬盤或內存中存儲信息)的單位。
應用:
如果數據庫中表為UTF8編碼,則其中字段設置為最長10位字符,則最多存入長度為 eg: '我是中1'
下面看下PHP字符串與字節轉換示例
<?php /** * byte數組與字符串轉化類 */ class Bytes { /** * 轉換一個String字符串為byte數組 * @param $str 需要轉換的字符串 * @param $bytes 目標byte數組 * @author Zikie */ public static function getBytes($string) { $bytes = array(); for($i = 0; $i < strlen($string); $i++){ $bytes[] = ord($string[$i]); } return $bytes; } /** * 將字節數組轉化為String類型的數據 * @param $bytes 字節數組 * @param $str 目標字符串 * @return 一個String類型的數據 */ public static function toStr($bytes) { $str = ''; foreach($bytes as $ch) { $str .= chr($ch); } return $str; } /** * 轉換一個int為byte數組 * @param $byt 目標byte數組 * @param $val 需要轉換的字符串 * */ public static function integerToBytes($val) { $byt = array(); $byt[0] = ($val & 0xff); $byt[1] = ($val >> 8 & 0xff); $byt[2] = ($val >> 16 & 0xff); $byt[3] = ($val >> 24 & 0xff); return $byt; } /** * 從字節數組中指定的位置讀取一個Integer類型的數據 * @param $bytes 字節數組 * @param $position 指定的開始位置 * @return 一個Integer類型的數據 */ public static function bytesToInteger($bytes, $position) { $val = 0; $val = $bytes[$position + 3] & 0xff; $val <<= 8; $val |= $bytes[$position + 2] & 0xff; $val <<= 8; $val |= $bytes[$position + 1] & 0xff; $val <<= 8; $val |= $bytes[$position] & 0xff; return $val; } /** * 轉換一個shor字符串為byte數組 * @param $byt 目標byte數組 * @param $val 需要轉換的字符串 * */ public static function shortToBytes($val) { $byt = array(); $byt[0] = ($val & 0xff); $byt[1] = ($val >> 8 & 0xff); return $byt; } /** * 從字節數組中指定的位置讀取一個Short類型的數據。 * @param $bytes 字節數組 * @param $position 指定的開始位置 * @return 一個Short類型的數據 */ public static function bytesToShort($bytes, $position) { $val = 0; $val = $bytes[$position + 1] & 0xFF; $val = $val << 8; $val |= $bytes[$position] & 0xFF; return $val; } } ?>