程式師世界 >> 數據庫知識 >> Oracle數據庫 >> 關於Oracle數據庫 >> Oracle 多行記錄合並/連接/聚合字符串的幾種方法

Oracle 多行記錄合並/連接/聚合字符串的幾種方法

編輯：關於Oracle數據庫

什麼是合並多行字符串（連接字符串）呢，例如：
SQL> desc test;
Name Type Nullable Default Comments
------- ------------ -------- ------- --------
COUNTRY VARCHAR2(20) Y
CITY VARCHAR2(20) Y

SQL> select * from test;

COUNTRY CITY
-------------------- --------------------
中國台北
中國香港
中國上海
日本東京
日本大阪
要求得到如下結果集：
------- --------------------
中國台北,香港,上海
日本東京，大阪
實際就是對字符實現一個聚合功能，我很奇怪為什麼Oracle沒有提供官方的聚合函數來實現它呢：）
下面就對幾種經常提及的解決方案進行分析（有一個評測標准最高★★★★★）：
1.被集合字段范圍小且固定型靈活性★ 性能★★★★ 難度 ★
這種方法的原理在於你已經知道CITY字段的值有幾種，且還不算太多，如果太多這個SQL就會相當的長。。看例子：
SQL> select t.country,
2 MAX(decode(t.city,'台北',t.city||',',NULL)) ||
3 MAX(decode(t.city,'香港',t.city||',',NULL))||
4 MAX(decode(t.city,'上海',t.city||',',NULL))||
5 MAX(decode(t.city,'東京',t.city||',',NULL))||
6 MAX(decode(t.city,'大阪',t.city||',',NULL))
7 from test t GROUP BY t.country
8 /

COUNTRY MAX(DECODE(T.CITY,'台北',T.CIT
-------------------- ------------------------------
中國台北,香港,上海,
日本東京,大阪,
大家一看，估計就明白了（如果不明白，好好補習MAX DECODE和分組）。這種方法無愧為最笨的方法，但是對某些應用來說，最有效的方法也許就是它。
2.固定表固定字段函數法靈活性★★ 性能★★★★ 難度 ★★
此法必須預先知道是哪個表，也就是說一個表就得寫一個函數，不過方法1的一個取值就要便捷多了。在大多數應用中，也不會存在大量這種合並字符串的需求。廢話完畢，看下面：
定義一個函數
create or replace function str_list( str_in in varchar2 )--分類字段
return varchar2
is
str_list varchar2(4000) default null;--連接後字符串
str varchar2(20) default null;--連接符號
begin
for x in ( select TEST.CITY from TEST where TEST.COUNTRY = str_in ) loop
str_list := str_list || str || to_char(x.city);
str := ', ';
end loop;
return str_list;
end;
使用：
SQL> select DISTINCT(T.country),list_func1(t.country) from test t;

COUNTRY LIST_FUNC1(T.COUNTRY)
-------------------- ----------------
中國台北, 香港, 上海
日本東京, 大阪

SQL> select t.country,str_list(t.country) from test t GROUP BY t.country;

COUNTRY STR_LIST(T.COUNTRY)
-------------------- -----------------------
中國台北, 香港, 上海
日本東京, 大阪
這個時候，使用分組和求唯一都可以滿足要求。它的原理就是，根據唯一的分組字段country，在函數裡面再次查詢該字段對應的所有被合並列，使用PL/SQL將其合並輸出。
3.靈活表函數法靈活性★★★ 性能★★★ 難度 ★★★
該方法是在方法2的基礎上，使用動態SQL，將表名和字段名稱傳入，從而達到靈活的目的。
create or replace function str_list2( key_name in varchar2,
key in varchar2,
coname in varchar2,
tname in varchar2 )
return varchar2
as
type rc is ref cursor;
str varchar2(4000);
sep varchar2(2);
val varchar2(4000);
cur rc;
begin
open cur for 'select '||coname||'
from '|| tname || '
where ' || key_name || ' = :x '
using key;
loop
fetch cur into val;
exit when cur%notfound;
str := str || sep || val;
sep := ', ';
end loop;
close cur;
return str;
end;
SQL> select test.country,
2 str_list2('COUNTRY', test.country, 'CITY', 'TEST') emplist
3 from test
4 group by test.country
5 /

COUNTRY EMPLIST
-------------------- -----------------
中國台北, 香港, 上海
日本東京, 大阪
4.一條SQL法靈活性★★★★ 性能★★ 難度 ★★★★
一條SQL的法則是某位大師提出的，大家曾經在某個時期都樂此不彼的尋求各種的問題一條SQL法，但是大師的意思似乎被曲解，很多性能差，可讀性差，靈活差的SQL都是這個原則產物，所謂畫虎不成反成犬類。不過，解決問題始終是第一原則，這裡還是給出一個比較有代表性的一條SQL方法。
SELECT country,max(substr(city,2)) city
FROM
(SELECT country,sys_connect_by_path(city,',') city
FROM
(SELECT country,city,country||rn rchild,country||(rn-1) rfather
FROM
(SELECT test.country ,test.city,row_number() over (PARTITION BY test.country ORDER BY test.city) rn FROM test))
CONNECT BY PRIOR rchild=rfather START WITH rfather LIKE '%0')
GROUP BY country;
下面分步解析，有4個FROM，就有4次結果集的操作。
step 1 給記錄加上序號rn
SQL> SELECT test.country ,test.city,row_number() over (PARTITION BY test.country ORDER BY test.city) rn
2 FROM test
3 /

COUNTRY CITY RN
-------------------- -------------------- ----------
日本大阪 1
日本東京 2
中國上海 1
中國台北 2
中國香港 3
step 2 創造子節點父節點
SQL> SELECT country,city,country||rn rchild,country||(rn-1) rfather
2 FROM
3 (SELECT test.country ,test.city,row_number() over (PARTITION BY test.country ORDER BY test.city) rn
4 FROM test)
5 /
日本大阪日本1 日本0
日本東京日本2 日本1
中國上海中國1 中國0
中國台北中國2 中國1
中國香港中國3 中國2
step 3 利用sys_connect_by_path生成結果集
SELECT country,sys_connect_by_path(city,',') city
FROM
(SELECT country,city,country||rn rchild,country||(rn-1) rfather
FROM
(SELECT test.country ,test.city,row_number() over (PARTITION BY test.country ORDER BY test.city) rn FROM test)) CONNECT BY PRIOR rchild=rfather START WITH rfather LIKE '%0'
日本 ,大阪
日本 ,大阪,東京
中國 ,上海
中國 ,上海,台北
中國 ,上海,台北,香港
step 4 最終步驟，篩選結果集合
SQL> SELECT country,max(substr(city,2)) city
2 FROM
3 (SELECT country,sys_connect_by_path(city,',') city
4 FROM
5 (SELECT country,city,country||rn rchild,country||(rn-1) rfather
6 FROM
7 (SELECT test.country ,test.city,row_number() over (PARTITION BY test.country ORDER BY test.city) rn
8 FROM test))
9 CONNECT BY PRIOR rchild=rfather START WITH rfather LIKE '%0')
10 GROUP BY country;

COUNTRY CITY
-------------------- -------
中國上海,台北,香港
日本大阪,東京

可謂是，7歪8搞，最後還是弄出來了，呵呵。 PS:(邏輯上是對的..但是寫的比較繁瑣,可以簡化!)
5.自定義聚合函數靈活性★★★★★ 性能★★★★★ 難度 ★★★★★
最後一個方法是我認為“王道”的方法，自定義聚合函數。
就如何我在本開始說的，為啥oracle沒有這種聚合函數呢？我也不知道，但oracle提供了聚合函數的API可以讓我方便的自己定義聚合函數。
詳細可以看Oracle Data Catridge guide這個文檔。連接如下：
http://www.oracle.com.cn/other/9ionlinedoc/appdev.920/a96595/toc.htm
下面給出一個簡單的例子：
SQL> SELECT t.country,strcat(t.city) FROM test t GROUP BY t.country;

COUNTRY STRCAT(T.CITY)
-------------------- ------------------
日本東京,大阪
中國台北,香港,上海
簡單吧，和官方的函數一樣的便捷高效。
函數：
CREATE OR REPLACE FUNCTION strcat(input varchar2 )
RETURN varchar2
PARALLEL_ENABLE AGGREGATE USING strcat_type;
TYPE:
create or replace type strcat_type as object (
cat_string varchar2(4000),
static function ODCIAggregateInitialize(cs_ctx In Out strcat_type) return number,
member function ODCIAggregateIterate(self In Out strcat_type,value in varchar2) return number,
member function ODCIAggregateMerge(self In Out strcat_type,ctx2 In Out strcat_type) return number,member function ODCIAggregateTerminate(self In Out strcat_type,returnValue Out
varchar2,flags in number) return number)
6.待發掘...

PS: 在 oracle 10g下,可以使用以下系統函數:
select id,WMSYS.WM_CONCAT(oid) oid
from table1
group by id
總結，合並字符串還有更多的方法希望大家能發掘，本文的目的主要是拋磚引玉，如果有新的發現我會繼續更新方法。需要注意的問題是，本文采用varchar2為例子，所以長度有限制，oracle的版本對方法的實現也影響。