程序師世界是廣大編程愛好者互助、分享、學習的平台，程序師世界有你更精彩！


設為首頁	加入收藏

首頁
編程語言: C語言|JAVA編程
 Python編程
網頁編程: ASP編程|PHP編程
 JSP編程
數據庫知識: MYSQL數據庫|SqlServer數據庫
 Oracle數據庫|DB2數據庫

程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> 關於MYSQL數據庫 >> 如何去除數據表中的重復數據

如何去除數據表中的重復數據

編輯：關於MYSQL數據庫

　　通常情況下，一個我們在做一個產品的時候，一開始可能由於設計考慮不周或者程序寫的不夠嚴謹，某個字段上的值產生重復了，但是又必須去掉，這個時候就稍微麻煩了一點，直接加一個UNIQUE KEY肯定是不行了，因為會報錯。

　　現在，我們來采用一種變通的辦法，不過可能會丟失一些數據 :)

　　在這裡，我們設定一個表，其結構如下：

MySQL> desc `user`;
+-------+------------------+------+-----+---------+----------------+
| FIEld | Type　　　　　　 | Null | Key | Default | Extra　　　　　|
+-------+------------------+------+-----+---------+----------------+
| id　　| int(10) unsigned | NO　 | PRI | NULL　　| auto_increment |
| name　| char(10)　　　　 | NO　 |　　 |　　　　 |　　　　　　　　|
| extra | char(10)　　　　 | NO　 |　　 |　　　　 |　　　　　　　　|
+-------+------------------+------+-----+---------+----------------+
　　原來表中的數據假定有以下幾條：

MySQL> SELECT * FROM `user`;
+----+-------+--------+
| id | name　| extra　|
+----+-------+--------+
|　1 | user1 | user1　|
|　2 | user2 | user2　|
|　3 | user3 | user3　|
|　4 | user4 | user4　|
|　5 | user5 | user5　|
|　6 | user3 | user6　|
|　7 | user6 | user7　|
|　8 | user2 | user8　|
|　9 | USER2 | user9　|
| 10 | USER6 | user10 |
+----+-------+--------+
　　1、將原來的數據導出

MySQL>SELECT * INTO OUTFILE '/tmp/user.txt' FROM `user`;
　　2、清空數據表

MySQL>TRUNCATE TABLE `user`;
　　3、創建唯一索引，並且修改 `name` 字段的類型為
BINARY CHAR
區分大小寫

MySQL> ALTER TABLE `user` MODIFY `name` CHAR(10) BINARY NOT NULL DEFAULT '';
MySQL> ALTER TABLE `user` ADD UNIQUE KEY ( `name` );
　　現在來看看新的表結構：

MySQL> desc user;
+-------+------------------+------+-----+---------+----------------+
| FIEld | Type　　　　　　 | Null | Key | Default | Extra　　　　　|
+-------+------------------+------+-----+---------+----------------+
| id　　| int(10) unsigned | NO　 | PRI | NULL　　| auto_increment |
| name　| char(10)　　　　 | NO　 | UNI |　　　　 |　　　　　　　　|
| extra | char(10)　　　　 | NO　 |　　 |　　　　 |　　　　　　　　|
+-------+------------------+------+-----+---------+----------------+
　　4、把數據導回去，在這裡，有兩種選擇：新的重復記錄替換舊的記錄，只保留最新的記錄或者是新的記錄略過，只保留最舊的記錄

MySQL> LOAD DATA INFILE '/tmp/user.txt' REPLACE INTO TABLE `user`;
Query OK, 10 rows affected (0.00 sec)
Records: 8　Deleted: 2　Skipped: 0　Warnings: 0
MySQL> SELECT * FROM USER;
+----+-------+--------+
| id | name　| extra　|
+----+-------+--------+
|　1 | user1 | user1　|
|　8 | user2 | user8　|
|　6 | user3 | user6　|
|　4 | user4 | user4　|
|　5 | user5 | user5　|
|　7 | user6 | user7　|
|　9 | USER2 | user9　|
| 10 | USER6 | user10 |
+----+-------+--------+
　　上面是采用REPLACE的方式，可以看到，導入過程中刪掉了兩條數據，結果驗證確實是新的重復記錄替換舊的記錄，只保留最新的記錄。

　　現在，來看看用IGNORE的方式：

MySQL> LOAD DATA INFILE '/tmp/user.txt' IGNORE INTO TABLE `user`;
Query OK, 6 rows affected (0.01 sec)
Records: 8　Deleted: 0　Skipped: 2　Warnings: 0
MySQL> SELECT * FROM USER;
+----+-------+--------+
| id | name　| extra　|
+----+-------+--------+
|　1 | user1 | user1　|
|　2 | user2 | user2　|
|　3 | user3 | user3　|
|　4 | user4 | user4　|
|　5 | user5 | user5　|
|　7 | user6 | user7　|
|　9 | USER2 | user9　|
| 10 | USER6 | user10 |
+----+-------+--------+
　　看到了吧，確實是新的記錄略過，只保留最舊的記錄。

上一頁:MySQL 4.0 升級到5.0
下一頁:mysqldump死住（實際是導致mysqld crash）

關於MYSQL數據庫

深入SQL語句性能調整

有些程序員在撰寫數據庫應用程序時，常專注於 OOP 及各種

MySQL數據庫服務器支持遠程連接的設置方法

機連接上數據庫服務器，如果想讓用戶通過另外一台

SQL Server 2005導入至2000的方法及注意事項

　　由於自己開發環境使用的是MS SQLServ

explain分析sql效率的方法

Explain命令在解決數據庫性能上是第一推薦使用命令，大部

淺談如何應用JDBC連接數據庫MySQL

最近在學習數據庫開發的一些實例，這裡淺談一下用JDBC連接

Mysql數據庫性能優化二

在上篇文章給大家介紹了mysql數據庫性能優化一，今天繼續接

相關文章

閱讀排行榜

MySQL查看和修改字符編碼的實現方法 MySQL存儲過程的字符集問題 mysql delete limit 使用方法詳解 MySQL隱藏空間相關問題的解答如何對MySQL服務器進行調優 Navicat異地自動備份MySQL方法詳解(圖文) mysql 動態執行存儲過程語句 MySQL服務器創建臨時文件數的合理配置 mysql insert語句操作實例講解探討SQL利用INFORMATION_SCHEMA系統視圖如何獲取表的主外鍵信息 ERROR: Error in Log_event::read_log_event()

熱門圖文

Oracle動態交叉表生成 MySQL5.4預覽版發布性能提高90% SQL2000 全文索引完全圖解 sqlserver中查詢橫表變豎表的sql語句簡析 SQL Server的怪辟：異常與孤立事務 Ora-01536：超出了表空間users的空間限量 JDBC驅動程序的類型 mysql學習記錄（十四）--模式

欄目導航

MYSQL入門知識 SQL基礎知識關於MYSQL數據庫 Mariadb數據庫 MySQL綜合教程

Copyright © 程式師世界 All Rights Reserved