經常會有朋友問到類似於這樣的問題,
表中的數據如下
ID AA BB
1 123 456
1 4535 54
1 60 6564
1 60 656
2 50 664
2 60 6
3 89 89
4 40 4242
希望得到的結果是
ID AA BB
1 123 456
2 50 664
3 89 89
4 40 4242
當然了,環境是SQL Server
解答及分析如下:
1, 不少朋友希望用distinct就解決問題,但不可能,disctinct將重復的記錄忽略,
但它忽略的是完全一致的重復記錄,而不是其中某個字段重復的記錄,所以也只有
這樣的語法
select distinct ID,AA,BB from tName
其它諸如select distinct(ID),AA,BB from tName 或
select ID,distinct AA,BB的寫法都是無效的
2, 使用group by和聚合函數
select ID,MAX(AA) AS AA,MAX(BB) AS BB from tName group by ID
可以得到如下結果
ID AA BB
1 4535 6564
2 60 664
3 89 89
4 40 4242
ID是唯一了,但不一定後面的字段是同一條記錄的
3, 使用臨時表
select IDENTITY(INT,1,1) as TID,ID,AA,BB into #Tmp from tName
select t1.ID,t1.AA,t1.BB from #Tmp t1 where t1.TID in
(select min(T2.TID) from #Tmp t2 group by t2.ID)
這樣可以得到符合要求的結果
不過用了兩個T-SQL語句,
而且如果是大數據量的話,性能問題將很突出
到目前為止,我還沒找到用一個T-SQL語句實現同樣功能的方法,
如果誰有,希望補充