問題遇到的現象和發生背景
我有一個csv 這個csv中有很多重復的列
我需要根據其中一列去判斷
若該列有兩行的內容一樣 則去判斷其他列是否一致 若一致 則刪除 若不一致 則保留 且其中一列不作為判斷條件
我想要達到的結果
原始數據
- 6
A 22 a b c d e
B 33 c a b d e
C 22 b b c d e
D 44 b c d e f
E 33 c b b d e
F 44 b c d e g
G 55 a b c d e
H 55 a b c d e
運行後我想要達到的結果
- 6
A 22 a b c d e
B 33 c a b d e
C 22 b b c d e
E 33 c b b d e
該例子中由1列為參照列 1列中A行C行內容相等 但這兩行2列不一樣 所以這兩行保留
1列中B行E行內容相等 但這兩行3列不一樣 所以這兩行保留
1列中D行F行內容相等 但這兩行6列不一樣 而第6列不被設定為判定條件 故刪除這兩行
1列中G行H行內容相等 但這兩行2345列一樣 所以這兩行刪除