Oracle 8 和Oracle 9i中缺乏靈活性的SQL 正則表達式最終在Oracle 10g中得到了解決。Oracle 數據庫目前內建了符合POSIX 標准的正則表達式。
四個新的函數分別是:REGEXP_LIKE、REGEXP_INSTR、REGEXP_SUBSTR、和 REGEXP_REPLACE。它們在用法上與Oracle SQL 函數LIKE、INSTR、SUBSTR 和REPLACE 用法,但是它們使用POSIX 正則表達式代替了老的百分號(%)和通配符(_)字符。
POSIX 正則表達式由標准的元字符(metacharacters)所構成:
可以使用"{m,n}" 指定一個精確地出現范圍,其意思是“出現從m 次到n 次”;"{m}" 表示“正好m次”;而"{m,}" 表示“至少m次”。還可以使用圓括號組合字符的集合,使用"|"(豎線)表示可替換。例如,字符串'^([a-z]+|[0-9]+)$'將匹配所有由小寫字母或數字組合成的字符串。
REGEXP_LIKE 與LIKE 操作符相似。如果第一個參數匹配正則表達式它就解析為TRUE。例如WHERE REGEXP_LIKE(ENAME,'^J[AO]','i') 將在ENAME 以JA 或JO 開始的情況下返回一行數據。'I' 參數指定正則表達式是大小寫敏感的。另外還可以在CHECK 約束和函數索引中指定REGEXP_LIKE。例如:
ALTER TABLE EMP ADD CONSTRAINT REGEX01
CHECK (REGEXP_LIKE(ENAME,'^[[:alpha:]]+$'));
這條語句使得ENAME 字段只能包含字母和數字字符(也就是說沒有空格或者標點符號)。試圖插入或者更新這些數據將導致一個ORA-2290 異常,或者檢查約束的有效性。
REGEXP_INSTR 與INSTR 函數類似。它返回一個字符串中匹配一個正則表達式的第一個子串的開始位置。例如:
SELECT REGEXP_INSTR('The total is $400 for your purchase.','$[[:digit:]]+')
FROM DUAL;
這個查詢返回14,即$400在字符串的開始位置。另外還可以指定子串出現的次數;開始搜索的位置;是返回匹配的位置還是返回匹配之後字符的位置。
REGEXP_SUBSTR 返回匹配一個正則表達式的子串。雖然結合使用SUBSTR 和REGEXP_INSTR 及LENGTH 也可以實現這一功能,但是使用這個函數卻更為簡單。
SELECT REGEXP_INSTR('one,two,three','[^,]*') FROM DUAL;
這個查詢返回'one',將第一個參數看成一個逗號分隔的列表並返回第一個逗號之前的所有字符。
REGEXP_REPLACE 返回初始參數被匹配子串替換之後的結果。例如:
SELECT REGEXP_REPLACE('The temperature is 23°F',
'([[:digit:]])+°F',
('\1'-32)*5/9||'°C')
FROM DUAL;
這個查詢將查找一個華氏溫度並將其轉換為攝氏度。它將返回:'The temperature is -5°C'。