在最近的開發需求中,涉及到刪除指定列值為空的行,通過查閱資料,使用.dropna可實現上述需求,為此特意寫下該篇文章用於日後的復盤和學習
缺失值刪除 df.dropna()https://blog.csdn.net/Hudas/article/details/122924791數據准備
import pandas as pd
import numpy as np
df = pd.DataFrame([['liver',np.nan,89,21,24,64],
['Arry','C',36,37,37,57],
[np.nan,np.nan,57,60,18,84],
['Eorge','C',93,96,71,np.nan],
[None,None,65,49,61,86]
],
columns = ['name','team','Q1','Q2','Q3','Q4'])
df
從上述df數據表可以看出,總共有6處空值
問題:刪除name,team兩列字段中數值為空的行
df = df.dropna(subset=['name','team'])
df(第一次處理)
經過第一次處理後的df數據表,可以看到Eorge那一行記錄中的Q4仍然為空(nan) ,如果想刪除Q4為空的記錄,可進行下述操作
df = df.dropna(subset=['name','team','Q4'])
df(第二次處理)
擴展補充資料
篩選和刪除目標值所在的行https://blog.csdn.net/Hudas/article/details/125394010?spm=1001.2014.3001.5501
篩選DataFrame含有空值的數據行https://blog.csdn.net/Hudas/article/details/125351275?spm=1001.2014.3001.5501