背景介紹
最近在設計數據庫的時候因為開始考慮不周,所以產生了大量的重復數據。現在需要把這些重復的數據刪除掉,使用到的語句就是Group By來完成。為了進一步了解這條語句的作用,我打算先從簡單入手。
建一個測試表
復制代碼 代碼如下:create table test_group(id int auto_increment primary key, name varchar(32), class varchar(32), score int);
查看表結構
desc test_group
插入數據
測試開始
我想知道當前每一個班級裡面最高分數的同學是誰。
復制代碼 代碼如下:select name, class , max(score) from test_group group by class;
好現在可以插入幾條重復的數據。
復制代碼 代碼如下:insert into test_group(name, class, score)values('repeat','B',89);
現在要過濾掉重復的數據,保留最新的那條記錄。一般我們假設最新的記錄是最後插入的那條,所以它的ID應該是最大的那條。
復制代碼 代碼如下:select name, class, max(id) from test_group group by name;
可以發現,我們關注那個項的重復性就把它放到gourp by後面。這樣我們就可以過濾掉那些與這個項重復的記錄啦。現在我們得到了我們需要的數據,我們下一步就是把那些重復的數據刪除。為了區分我們過濾出來的數據記錄與原有的記錄,我們可以給id取一個別名。
復制代碼 代碼如下:select name, class, max(id) as max_id from test_group group by name;
下一步就是把這些關心的數據保留下來,我先把這些數據的id
提取出來。因為這個是唯一確定一條記錄的。
復制代碼 代碼如下:select max_id from (select name, class, max(id) as max_id from test_group group by name)b;
下面就是刪除操作了。思路就是刪除那些數據ID不在我們查詢結果裡面的記錄。為了方便操作後對數據的對比,我先進行一次全部查詢。
復制代碼 代碼如下:select * from test_group;
執行刪除操作。
復制代碼 代碼如下:delete from test_group where id not in (select max_id from (select name, class, max(id) as max_id from test_group group by name)b);
最後查看結果。
總結
MySQL操作還是很靈活的,之前一直喜歡用ORM現在感覺直接使用MYSQL省去了很多事。如果你有更好更高效的方式就請你分享分享吧~~
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持。