Oracle 正則表達式實例詳解
FORM開發中的按行拆分需求:拆分後的行要有規律,並按前後層次排序
需求分析如下:
現有行: 2 , 2.1 , 2.2 , 2.3 3
2.1.1, 2.1.2 , 2.1.3 , 2.2.1 , 2.1.1.1, 2.1.1.2,
對 2 進行拆分得到的 結果應該是 2.4 (2.4 是通過 查看歷史記錄中以2 開頭,有一位小數點,小數點後一位最大值,獲得該最大值+1 ,得到既是新行的後綴,保證拆分是按照前後順序遞增的)
對 2.1 進行拆分得到的應該是 :2.1.4 首先要保證 每次拆分得到的下一行都是多一位小數點
對2.1 拆分 獲取最大後綴 比較對象 時候 應該匹配前綴是2.1的 且只有兩位小數點的 (排除前綴符合位數不符合的情況:2.1.1.1 ,2.1.1.2 )
對3 進行拆分 沒有歷史記錄是以 3開頭的情況 這時候 就要重新 開始拆分:得到的應該是 3.1
這裡的關鍵就是匹配歷史記錄進行比較,決定拆分後的最後一位的最大值
匹配的時候不能按照 數字的位數來判斷,因為數字有可能是兩位數,三位數,應該根據小數點來判斷
匹配要使用到 正則表達式:
與PHP、Python一樣Oracle 的正則表達式函數也是 主要由四個函數實現:相似匹配,定位查找,獲取匹配子字符串,替換匹配結果(最重要)
(1)相似匹配: regexp_like()
regexp(source_str,pattern,match_parameter)
第一個參數:原字符串,第二個參數匹配模式,第三個參數匹配選項
第三個參數 匹配選項在這幾個函數中都要相似作用(可選)
常用: i:大小寫不敏感; c:大小寫敏感; n:點號 . 不匹配換行符號;
m:多行模式; x:擴展模式,忽略正則表達式中的空白字符。
匹配成功返回true 失敗返回 false
我的使用:
IF REGEXP_LIKE(DEL_LINE_NUMBER, '^\d*\.\d*\.\d*$') THEN --匹配只有兩個小數點的數字,字符串
模式中的符號說明:模式需要用一對雙引號括起來
^ 標明字符串的開頭, $ 標明字符串的結尾
\d 匹配 一個0-9 的數字 * 號 匹配前面的字符0次或更多次
\. 匹配一個點號,因為點號有其他含義,所以用\作為轉義
(2)定位查找字符位置:regexp_instr( )
regexp_instr(source_string ,pattern,position,occurrence ,return_option ,match_parameter ) source_string:輸入的字符串 pattern:正則表達式 position:標識從第幾個字符開始正則表達式匹配。(默認為1) occurrence:標識第幾個匹配組。(默認為1) return_option:0——返回第一個字符出現的位置。1:pattern下一個字符起始位置。 match_parameter:匹配模式
前面兩個字段必輸:
regexp_instr() select str, regexp_instr(str,'\.' ) ind , 默認從第一個字符開始查找,查找第一個.號,也可以匹配資格符合要求的字符串,寫對匹配格式即可,不一定是單個字符 regexp_instr(str,'\.',1,2) ind , 從第1個字符開始,查找第二個.號所在的位置 regexp_instr(str,'\.',5,2) ind 從第五個字符開始,查找第二個.號的位置,注意最終查找到的字符和字符串的位置是相對於查找字符串的起始位置 fromtmp where id='instr'; STR IND IND IND --------------- ----- ----- ----- 192.168.0.1 4 8 10
select regexp_instr('192.168.0.1','\.',1,level) ind , -- 點號. 所在的位置 regexp_instr('192.168.0.1','\d',1,level) ind -- 每個數字的位置 fromdual connectbylevel <= 9 連續匹配目標字符串出現的第一次出現的位置,第二次出現的位置,直到第九次出現的位置 IND IND ----- ----- 4 1 8 2 10 3 0 5 0 6 0 7 0 9 0 11 -- 第八個數字所在位置為 11 這裡不存在第九個數字,匹配不到,返回的地址為0 0 0 -- 沒有匹配到時返回為0 ,對應第一位是從1開始,而不是0 開始
我的案例:
V_POSITION_BIT := REGEXP_INSTR(REC_DATA.DEL_LINE_NUMBER,'\.',1,2) -1; -- 第二個小數點的位數,減一
substr(DEL_LINE_NUMBER,1,V_POSITION_BIT) -- 獲取字符串中第二個小數點之前的子串
(3) 獲取匹配子字符串:regexp_substr()
regexp_substr(source_string ,pattern,position,occurrence ,match_parameter)
regexp_substr()在最初目的是根據字符串中某一個字符,分割字符串形成一個數組之類的
例如: 192.168.233.23 按點號"." 分組 最終結果有四個 :192 168 233 23
注意的是 pattern書寫的格式不僅僅要用括號括起來,還要使用中括號括起來
我的案例:
REGEXP_SUBSTR(DEL_LINE_NUMBER,'[^.]+',1,1) -- 匹配前綴相同,第一個小數點前的字符 select str, regexp_substr(str,'[^,]+') str, regexp_substr(str,'[^,]+',1,1) str, 從第一位開始匹配,獲得用逗號分隔字符串之後,第一個‘分割後的子串' regexp_substr(str,'[^,]+',1,2) str, -- occurrence 第幾個匹配組 regexp_substr(str,'[^,]+',2,1) str -- position 從第幾個字符開始匹配 fromtmp whereid='substr'; STR STR STR STR STR --------------- --------------- --------------- --------------- --------------- 123,234,345 123 123 234 23 12,34.56:78 12 12 34.56:78 2 123456789 123456789 123456789 逗號分割後不存在第二個 23456789(從第二位之後開始分割,沒有就是取整體)
(4) 替換匹配結果:regexp_replace()
select str, regexp_replace(str,'020','GZ') str, regexp_replace(str,'(\d{3})(\d{3})','<\2\1>') str -- 將第一、第二捕獲組交換位置,用尖括號標識出來 fromtmp whereid='replace'; STR STR STR --------------- --------------- --------------- (020)12345678 (GZ)12345678 (020)<456123>78 001517729C28 001517729C28 <517001>729C28
感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!