符串或串(String)是由零個或多個字符組成的有限序列。一般記為 s='a1a2•••an'(n>=0)。它是編程語言中表示文本的數據類型。
通常以串的整體作為操作對象,如:在串中查找某個子串、求取一個子串、在串的某個位置上插入一個子串以及刪除一個子串等。兩個字符串相等的充要條件是:長度相等,並且各個對應位置上的字符都相等。設p、q是兩個串,求q在p中首次出現的位置的運算叫做模式匹配。串的兩種最基本的存儲方式是順序存儲方式和鏈接存儲方式。
下面我們來看看MySQL中的字符串函數
假如結果的長度大於 max_allowed_packet 系統變量的最大值時,字符串值函數的返回值為NULL。
對於在字符串位置操作的函數,第一個位置的編號為 1。
◆ ASCII(str)
返回值為字符串str 的最左字符的數值。假如str為空字符串,則返回值為 0 。假如str 為NULL,則返回值為 NULL。 ASCII()用於帶有從 0到255的數值的字符。
mysql> SELECT ASCII('2');
-> 50
mysql> SELECT ASCII(2);
-> 50
mysql> SELECT ASCII('dx');
-> 100
見 ORD()函數。
◆ BIN(N)
返回值為N的二進制值的字符串表示,其中 N 為一個longlong (BIGINT) 數字。這等同於 CONV(N,10,2)。假如N 為NULL,則返回值為 NULL。
mysql> SELECT BIN(12);-> '1100'
◆ BIT_LENGTH(str)
返回值為二進制的字符串str 長度。
mysql> SELECT BIT_LENGTH('text');-> 32
◆ CHAR(N,... [USING charset])
CHAR()將每個參數N理解為一個整數,其返回值為一個包含這些整數的代碼值所給出的字符的字符串。NULL值被省略。
mysql> SELECT CHAR(77,121,83,81,'76');-> 'MySQL'mysql> SELECT CHAR(77,77.3,'77.3');-> 'MMM'
大於 255的CHAR()參數被轉換為多結果字符。 例如,CHAR(256) 相當於 CHAR(1,0), 而CHAR(256*256) 則相當於 CHAR(1,0,0):
mysql> SELECT HEX(CHAR(1,0)), HEX(CHAR(256));+----------------+----------------+| HEX(CHAR(1,0)) | HEX(CHAR(256)) |+----------------+----------------+| 0100 | 0100 |+----------------+----------------+mysql> SELECT HEX(CHAR(1,0,0)), HEX(CHAR(256*256));+------------------+--------------------+| HEX(CHAR(1,0,0)) | HEX(CHAR(256*256)) |+------------------+--------------------+| 010000 | 010000 |+------------------+--------------------+
CHAR()的返回值為一個二進制字符串。可選擇使用USING語句產生一個給出的字符集中的字符串:
mysql> SELECT CHARSET(CHAR(0x65)), CHARSET(CHAR(0x65 USING utf8));mysql> SELECT CHARSET(CHAR(0x65)), CHARSET(CHAR(0x65 USING utf8));+---------------------+--------------------------------+| CHARSET(CHAR(0x65)) | CHARSET(CHAR(0x65 USING utf8)) |+---------------------+--------------------------------+| binary | utf8 |+---------------------+--------------------------------+
如果 USING已經產生,而結果字符串不符合給出的字符集,則會發出警告。同樣,如果嚴格的SQL模式被激活,則CHAR()的結果會成為 NULL。
◆ CHAR_LENGTH(str)
返回值為字符串str 的長度,長度的單位為字符。一個多字節字符算作一個單字符。對於一個包含五個二字節字符集, LENGTH()返回值為 10, 而CHAR_LENGTH()的返回值為5。
◆ CHARACTER_LENGTH(str)
CHARACTER_LENGTH()是CHAR_LENGTH()的同義詞。
◆ COMPRESS(string_to_compress)
壓縮一個字符串。這個函數要求 MySQL已經用一個諸如zlib的壓縮庫壓縮過。 否則,返回值始終是NULL。UNCOMPRESS() 可將壓縮過的字符串進行解壓縮。
mysql> SELECT LENGTH(COMPRESS(REPEAT('a',1000)));-> 21mysql> SELECT LENGTH(COMPRESS(''));-> 0mysql> SELECT LENGTH(COMPRESS('a'));-> 13mysql> SELECT LENGTH(COMPRESS(REPEAT('a',16)));-> 15
壓縮後的字符串的內容按照以下方式存儲:
空字符串按照空字符串存儲。
非空字符串未壓縮字符串的四字節長度進行存儲(首先為低字節),後面是壓縮字符串。如果字符串以空格結尾,就會在後加一個"."號,以防止當結果值是存儲在CHAR或VARCHAR類型的字段列時,出現自動把結尾空格去掉的現象。(不推薦使用 CHAR 或VARCHAR 來存儲壓縮字符串。最好使用一個 BLOB 列代替)。
◆ CONCAT(str1,str2,...)
返回結果為連接參數產生的字符串。如有任何一個參數為NULL ,則返回值為 NULL。或許有一個或多個參數。 如果所有參數均為非二進制字符串,則結果為非二進制字符串。 如果自變量中含有任一二進制字符串,則結果為一個二進制字符串。一個數字參數被轉化為與之相等的二進制字符串格式;若要避免這種情況,可使用顯式類型 cast, 例如: SELECT CONCAT(CAST(int_col AS CHAR), char_col)
mysql> SELECT CONCAT('My', 'S', 'QL');-> 'MySQL'mysql> SELECT CONCAT('My', NULL, 'QL');-> NULLmysql> SELECT CONCAT(14.3);-> '14.3'
◆ CONCAT_WS(separator,str1,str2,...)
CONCAT_WS() 代表 CONCAT With Separator ,是CONCAT()的特殊形式。 第一個參數是其它參數的分隔符。分隔符的位置放在要連接的兩個字符串之間。分隔符可以是一個字符串,也可以是其它參數。如果分隔符為 NULL,則結果為 NULL。函數會忽略任何分隔符參數後的 NULL 值。
mysql> SELECT CONCAT_WS(',','First name','Second name','Last Name');-> 'First name,Second name,Last Name'mysql> SELECT CONCAT_WS(',','First name',NULL,'Last Name');-> 'First name,Last Name'
CONCAT_WS()不會忽略任何空字符串。 (然而會忽略所有的 NULL)。
◆ CONV(N,from_base,to_base)
不同數基間轉換數字。返回值為數字的N字符串表示,由from_base基轉化為 to_base 基。如有任意一個參數為NULL,則返回值為 NULL。自變量 N 被理解為一個整數,但是可以被指定為一個整數或字符串。最小基數為 2 ,而最大基數則為 36。 If to_base 是一個負數,則 N 被看作一個帶符號數。否則, N 被看作無符號數。 CONV() 的運行精確度為 64比特。
mysql> SELECT CONV('a',16,2);-> '1010'mysql> SELECT CONV('6E',18,8);-> '172'mysql> SELECT CONV(-17,10,-18);-> '-H'mysql> SELECT CONV(10+'10'+'10'+0xa,10,10);-> '40'
◆ ELT(N,str1,str2,str3,...)
若N = 1,則返回值為 str1 ,若N = 2,則返回值為 str2 ,以此類推。若N 小於1或大於參數的數目,則返回值為 NULL 。 ELT() 是 FIELD()的補數。
mysql> SELECT ELT(1, 'ej', 'Heja', 'hej', 'foo');-> 'ej'mysql> SELECT ELT(4, 'ej', 'Heja', 'hej', 'foo');-> 'foo'
◆ EXPORT_SET(bits,on,off[,separator[,number_of_bits]])
返回值為一個字符串,其中對於bits值中的每個位組,可以得到一個 on 字符串,而對於每個清零比特位,可以得到一個off 字符串。bits 中的比特值按照從右到左的順序接受檢驗 (由低位比特到高位比特)。字符串被分隔字符串分開(默認為逗號‘,'),按照從左到右的順序被添加到結果中。number_of_bits 會給出被檢驗的二進制位數 (默認為 64)。
mysql> SELECT EXPORT_SET(5,'Y','N',',',4);-> 'Y,N,Y,N'mysql> SELECT EXPORT_SET(6,'1','0',',',10);-> '0,1,1,0,0,0,0,0,0,0'
◆ FIELD(str,str1,str2,str3,...)
返回值為str1, str2, str3,……列表中的str 指數。在找不到str 的情況下,返回值為 0 。
如果所有對於FIELD() 的參數均為字符串,則所有參數均按照字符串進行比較。如果所有的參數均為數字,則按照數字進行比較。否則,參數按照雙倍進行比較。
如果str 為NULL,則返回值為0 ,原因是NULL不能同任何值進行同等比較。FIELD() 是ELT()的補數。
mysql> SELECT FIELD('ej', 'Hej', 'ej', 'Heja', 'hej', 'foo');-> 2mysql> SELECT FIELD('fo', 'Hej', 'ej', 'Heja', 'hej', 'foo');-> 0
◆ FIND_IN_SET(str,strlist)
假如字符串str 在由N 子鏈組成的字符串列表strlist 中, 則返回值的范圍在 1 到 N 之間 。一個字符串列表就是一個由一些被‘,'符號分開的自鏈組成的字符串。如果第一個參數是一個常數字符串,而第二個是type SET列,則 FIND_IN_SET() 函數被優化,使用比特計算。如果str不在strlist 或strlist 為空字符串,則返回值為 0 。如任意一個參數為NULL,則返回值為 NULL。 這個函數在第一個參數包含一個逗號(‘,')時將無法正常運行。
mysql> SELECT FIND_IN_SET('b','a,b,c,d');-> 2
◆ FORMAT(X,D)
將number X設置為格式 '#,###,###.##', 以四捨五入的方式保留到小數點後D位, 而返回結果為一個字符串。
◆ HEX(N_or_S)
如果N_OR_S 是一個數字,則返回一個 十六進制值 N 的字符串表示,在這裡, N 是一個longlong (BIGINT)數。這相當於 CONV(N,10,16)。
如果N_OR_S 是一個字符串,則返回值為一個N_OR_S的十六進制字符串表示, 其中每個N_OR_S 裡的每個字符被轉化為兩個十六進制數字。
mysql> SELECT HEX(255);-> 'FF'mysql> SELECT 0x616263;-> 'abc'mysql> SELECT HEX('abc');-> 616263
◆ INSERT(str,pos,len,newstr)
返回字符串 str, 其子字符串起始於 pos 位置和長期被字符串 newstr取代的len 字符。 如果pos 超過字符串長度,則返回值為原始字符串。 假如len的長度大於其它字符串的長度,則從位置pos開始替換。若任何一個參數為null,則返回值為NULL。
mysql> SELECT INSERT('Quadratic', 3, 4, 'What');-> 'QuWhattic'mysql> SELECT INSERT('Quadratic', -1, 4, 'What');-> 'Quadratic'mysql> SELECT INSERT('Quadratic', 3, 100, 'What');-> 'QuWhat'
這個函數支持多字節字元。
◆ INSTR(str,substr)
返回字符串 str 中子字符串的第一個出現位置。這和LOCATE()的雙參數形式相同,除非參數的順序被顛倒。
mysql> SELECT INSTR('foobarbar', 'bar');-> 4mysql> SELECT INSTR('xbar', 'foobar');-> 0
這個函數支持多字節字元,並且只有當至少有一個參數是二進制字符串時區分大小寫。
◆ LCASE(str)
LCASE() 是 LOWER()的同義詞。
◆ LEFT(str,len)
返回從字符串str 開始的len 最左字符。
mysql> SELECT LEFT('foobarbar', 5);-> 'fooba'
◆ LENGTH(str)
返回值為字符串str 的長度,單位為字節。一個多字節字符算作多字節。這意味著 對於一個包含5個2字節字符的字符串, LENGTH() 的返回值為 10, 而 CHAR_LENGTH()的返回值則為5。
mysql> SELECT LENGTH('text');-> 4
◆ LOAD_FILE(file_name)
讀取文件並將這一文件按照字符串的格式返回。 文件的位置必須在服務器上,你必須為文件制定路徑全名,而且你還必須擁有FILE 特許權。文件必須可讀取,文件容量必須小於 max_allowed_packet字節。
若文件不存在,或因不滿足上述條件而不能被讀取, 則函數返回值為 NULL。
mysql> UPDATE tbl_nameSET blob_column=LOAD_FILE('/tmp/picture')WHERE id=1;
◆ LOCATE(substr,str) , LOCATE(substr,str,pos)
第一個語法返回字符串 str中子字符串substr的第一個出現位置。第二個語法返回字符串 str中子字符串substr的第一個出現位置, 起始位置在pos。如若substr 不在str中,則返回值為0。
mysql> SELECT LOCATE('bar', 'foobarbar');-> 4mysql> SELECT LOCATE('xbar', 'foobar');-> 0mysql> SELECT LOCATE('bar', 'foobarbar',5);-> 7
這個函數支持多字節字元,並且只有當至少有一個參數是二進制字符串時區分大小寫。
◆ LOWER(str)
返回字符串 str 以及所有根據最新的字符集映射表變為小寫字母的字符 (默認為 cp1252 Latin1)。
mysql> SELECT LOWER('QUADRATICALLY');-> 'quadratically'
這個函數支持多字節字元。
◆ LPAD(str,len,padstr)
返回字符串 str, 其左邊由字符串padstr 填補到len 字符長度。假如str 的長度大於len, 則返回值被縮短至 len 字符。
mysql> SELECT LPAD('hi',4,'??');-> '??hi'mysql> SELECT LPAD('hi',1,'??');-> 'h'
◆ LTRIM(str)
返回字符串 str ,其引導空格字符被刪除。
mysql> SELECT LTRIM(' barbar');-> 'barbar'
這個函數支持多字節字元。
◆ MAKE_SET(bits,str1,str2,...)
返回一個設定值 (一個包含被‘,'號分開的字字符串的字符串) ,由在bits 組中具有相應的比特的字符串組成。str1 對應比特 0, str2 對應比特1,以此類推。str1, str2, ...中的 NULL值不會被添加到結果中。
mysql> SELECT MAKE_SET(1,'a','b','c');-> 'a'mysql> SELECT MAKE_SET(1 | 4,'hello','nice','world');-> 'hello,world'mysql> SELECT MAKE_SET(1 | 4,'hello','nice',NULL,'world');-> 'hello'mysql> SELECT MAKE_SET(0,'a','b','c');-> ''
◆ MID(str,pos,len)
MID(str,pos,len) 是 SUBSTRING(str,pos,len)的同義詞。
◆ OCT(N)
返回一個 N的八進制值的字符串表示,其中 N 是一個longlong (BIGINT)數。這等同於CONV(N,10,8)。若N 為 NULL ,則返回值為NULL。
mysql> SELECT OCT(12);-> '14'
◆ OCTET_LENGTH(str)
OCTET_LENGTH() 是 LENGTH()的同義詞。
◆ ORD(str)
若字符串str 的最左字符是一個多字節字符,則返回該字符的代碼, 代碼的計算通過使用以下公式計算其組成字節的數值而得出:
(1st byte code)+ (2nd byte code × 256)+ (3rd byte code × 2562) ...
假如最左字符不是一個多字節字符,那麼 ORD()和函數ASCII()返回相同的值。
mysql> SELECT ORD('2');-> 50
◆ POSITION(substr IN str)
POSITION(substr IN str)是 LOCATE(substr,str)同義詞。
◆ QUOTE(str)
引證一個字符串,由此產生一個在SQL語句中可用作完全轉義數據值的結果。 返回的字符串由單引號標注,每例都帶有單引號 (‘'')、 反斜線符號 (‘')、 ASCII NUL以及前面有反斜線符號的Control-Z 。如果自變量的值為NULL, 則返回不帶單引號的單詞 “NULL”。
mysql> SELECT QUOTE('Don't!');-> 'Don't!'mysql> SELECT QUOTE(NULL);-> NULL
◆ REPEAT(str,count)
返回一個由重復的字符串str 組成的字符串,字符串str的數目等於count 。若 count <= 0,則返回一個空字符串。若str 或 count 為 NULL,則返回 NULL 。
mysql> SELECT REPEAT('MySQL', 3);-> 'MySQLMySQLMySQL'
◆ REPLACE(str,from_str,to_str)
返回字符串str 以及所有被字符串to_str替代的字符串from_str 。
mysql> SELECT REPLACE('www.mysql.com', 'w', 'Ww');-> 'WwWwWw.mysql.com'
這個函數支持多字節字元。
◆ REVERSE(str)
返回字符串 str ,順序和字符順序相反。
mysql> SELECT REVERSE('abc');-> 'cba'
這個函數支持多字節字元。
◆ RIGHT(str,len)
從字符串str 開始,返回最右len 字符。
mysql> SELECT RIGHT('foobarbar', 4);-> 'rbar'
這個函數支持多字節字元。
◆ RPAD(str,len,padstr)
返回字符串str, 其右邊被字符串 padstr填補至len 字符長度。假如字符串str 的長度大於 len,則返回值被縮短到與 len 字符相同長度。
mysql> SELECT RPAD('hi',5,'?');-> 'hi???'mysql> SELECT RPAD('hi',1,'?');-> 'h'
這個函數支持多字節字元。
◆ RTRIM(str)
返回字符串 str ,結尾空格字符被刪去。
mysql> SELECT RTRIM('barbar ');-> 'barbar'
這個函數支持多字節字元。
◆ SOUNDEX(str)
從str返回一個soundex字符串。 兩個具有幾乎同樣探測的字符串應該具有同樣的 soundex 字符串。一個標准的soundex 字符串的長度為4個字符,然而SOUNDEX() 函數會返回一個人以長度的字符串。 可使用結果中的SUBSTRING() 來得到一個標准 soundex 字符串。在str中,會忽略所有未按照字母順序排列的字符。 所有不在A-Z范圍之內的國際字母符號被視為元音字母。
mysql> SELECT SOUNDEX('Hello');-> 'H400'mysql> SELECT SOUNDEX('Quadratically');-> 'Q36324'
注意:這個函數執行原始的Soundex算法,而非更加流行的加強版本(如D. Knuth所述)。其區別在於原始版本首先會刪去元音,其次是重復,而加強版則首先刪去重復,而後刪去元音。
◆ expr1 SOUNDS LIKE expr2
這相當於SOUNDEX(expr1) = SOUNDEX(expr2)。
◆ SPACE(N)
返回一個由N 間隔符號組成的字符串。
mysql> SELECT SPACE(6);-> ' '
◆ SUBSTRING(str,pos) , SUBSTRING(str FROM pos) SUBSTRING(str,pos,len) , SUBSTRING(str FROM pos FOR len)
不帶有len 參數的格式從字符串str返回一個子字符串,起始於位置 pos。帶有len參數的格式從字符串str返回一個長度同len字符相同的子字符串,起始於位置 pos。 使用 FROM的格式為標准 SQL 語法。也可能對pos使用一個負值。假若這樣,則子字符串的位置起始於字符串結尾的pos 字符,而不是字符串的開頭位置。在以下格式的函數中可以對pos 使用一個負值。
mysql> SELECT SUBSTRING('Quadratically',5);-> 'ratically'mysql> SELECT SUBSTRING('foobarbar' FROM 4);-> 'barbar'mysql> SELECT SUBSTRING('Quadratically',5,6);-> 'ratica' mysql> SELECT SUBSTRING('Sakila', -3);-> 'ila' mysql> SELECT SUBSTRING('Sakila', -5, 3);-> 'aki'mysql> SELECT SUBSTRING('Sakila' FROM -4 FOR 2);-> 'ki'
這個函數支持多字節字元。
注意,如果對len使用的是一個小於1的值,則結果始終為空字符串。
SUBSTR()是 SUBSTRING()的同義詞。
◆ SUBSTRING_INDEX(str,delim,count)
在定界符 delim 以及count 出現前,從字符串str返回自字符串。若count為正值,則返回最終定界符(從左邊開始)左邊的一切內容。若count為負值,則返回定界符(從右邊開始)右邊的一切內容。
mysql> SELECT SUBSTRING_INDEX('www.mysql.com', '.', 2);-> 'www.mysql'mysql> SELECT SUBSTRING_INDEX('www.mysql.com', '.', -2);-> 'mysql.com'
這個函數支持多字節字元。
◆ TRIM([{BOTH | LEADING | TRAILING} [remstr] FROM] str) TRIM(remstr FROM] str)
返回字符串 str , 其中所有remstr 前綴和/或後綴都已被刪除。若分類符BOTH、LEADIN或TRAILING中沒有一個是給定的,則假設為BOTH 。 remstr 為可選項,在未指定情況下,可刪除空格。
mysql> SELECT TRIM(' bar ');-> 'bar'mysql> SELECT TRIM(LEADING 'x' FROM 'xxxbarxxx');-> 'barxxx'mysql> SELECT TRIM(BOTH 'x' FROM 'xxxbarxxx');-> 'bar'mysql> SELECT TRIM(TRAILING 'xyz' FROM 'barxxyz');-> 'barx'
這個函數支持多字節字元。
◆ UCASE(str)
UCASE()是UPPER()的同義詞。
◆ UNCOMPRESS(string_to_uncompress)
對經COMPRESS()函數壓縮後的字符串進行解壓縮。若參數為壓縮值,則結果為 NULL。這個函數要求 MySQL 已被諸如zlib 之類的壓縮庫編譯過。否則, 返回值將始終是 NULL。
mysql> SELECT UNCOMPRESS(COMPRESS('any string'));-> 'any string'mysql> SELECT UNCOMPRESS('any string');-> NULL
◆ UNCOMPRESSED_LENGTH(compressed_string)
返回壓縮字符串壓縮前的長度。
mysql> SELECT UNCOMPRESSED_LENGTH(COMPRESS(REPEAT('a',30)));-> 30
◆ UNHEX(str)
執行從HEX(str)的反向操作。就是說,它將參數中的每一對十六進制數字理解為一個數字,並將其轉化為該數字代表的字符。結果字符以二進制字符串的形式返回。
mysql> SELECT UNHEX('4D7953514C');-> 'MySQL'mysql> SELECT 0x4D7953514C;-> 'MySQL'mysql> SELECT UNHEX(HEX('string'));-> 'string'mysql> SELECT HEX(UNHEX('1267'));-> '1267'
◆ UPPER(str)
返回字符串str, 以及根據最新字符集映射轉化為大寫字母的字符 (默認為cp1252 Latin1).
mysql> SELECT UPPER('Hej');-> 'HEJ'
該函數支持多字節字元。