程式師世界 >> 數據庫知識 >> Oracle數據庫 >> 關於Oracle數據庫 >> oracle sql 去重復記錄不用distinct如何實現

oracle sql 去重復記錄不用distinct如何實現

編輯：關於Oracle數據庫

用distinct關鍵字只能過濾查詢字段中所有記錄相同的（記錄集相同），而如果要指定一個字段卻沒有效果，另外distinct關鍵字會排序，效率很低。
select distinct name from t1 能消除重復記錄，但只能取一個字段，現在要同時取id,name這2個字段的值。
select distinct id,name from t1 可以取多個字段，但只能消除這2個字段值全部相同的記錄
所以用distinct達不到想要的效果，用group by 可以解決這個問題。
例如要顯示的字段為A、B、C三個，而A字段的內容不能重復可以用下面的語句：
select A, min(B),min(C),count(*) from [table] where [條件] group by A
having [條件] order by A desc
為了顯示標題頭好看點可以把select A, min(B),min(C),count(*) 換稱select A as A, min(B) as B,min(C) as C,count(*) as 重復次數
顯示出來的字段和排序字段都要包括在group by 中
但顯示出來的字段包有min,max,count,avg,sum等聚合函數時可以不在group by 中
如上句的min(B),min(C),count(*)
一般條件寫在where 後面
有聚合函數的條件寫在having 後面
如果在上句中having加 count(*)>1 就可以查出記錄A的重復次數大於1的記錄
如果在上句中having加 count(*)>2 就可以查出記錄A的重復次數大於2的記錄
如果在上句中having加 count(*)>=1 就可以查出所有的記錄，但重復的只顯示一條，並且後面有顯示重復的次數----這就是所需要的結果，而且語句可以通過hibernate
下面語句可以查詢出那些數據是重復的：
select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1
將上面的>號改為=號就可以查詢出沒有重復的數據了。
例如
代碼如下：

select count(*) from (select gcmc,gkrq,count(*) from gczbxx_zhao t group by gcmc,gkrq having
count(*)>=1 order by GKRQ)
select * from gczbxx_zhao where viewid in ( select max(viewid) from gczbxx_zhao group by
gcmc ) order by gkrq desc ---還是這個可行
。
有一面試題說：distinct去重復的效率很底下，我在網上看到這遍文章的方法好像說是用 group by having 效率很高了？
我在了一個測試，有一商品表，26萬條記錄，只有商品編號建了索引，對品牌名稱字段做 distinct
代碼如下：

select brand,count(*) from tab_commbaseinfo group by brand having count(*) =1

平均時間是：0.453
代碼如下：

select distinct brand from tab_commbaseinfo

平均時間是：0.39
搞不懂是否還有其它方法。