Pandas
是數據挖掘常見的工具,掌握使用過程中的函數是非常重要的。本文將借助可視化的過程,講解Pandas
的各種操作。
(dogs[dogs['size'] == 'medium']
.sort_values('type')
.groupby('type').median()
)
執行步驟:
size列篩選出部分行
然後將行的類型進行轉換
按照type列進行分組,計算中位數
dogs['longevity']
dogs.groupby('size').mean()
執行步驟:
將數據按照size進行分組
在分組內進行聚合操作
dogs.groupby(['type', 'size'])
(dogs
.sort_values('size')
.groupby('size')['height']
.agg(['sum', 'mean', 'std'])
)
執行步驟
按照size列對數據進行排序
按照size進行分組
對分組內的height進行計算
df.loc[:, df.loc['two'] <= 20]
dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']
dogs.drop(columns=['type'])
ppl.join(dogs)
ppl.merge(dogs, left_on='likes', right_on='breed', how='left')
dogs.pivot_table(index='size', columns='kids', values='price')
dogs.melt()
dogs.pivot(index='size', columns='kids')
dogs.stack()
dogs.unstack()
dogs.reset_index()
dogs.set_index('breed')
來源:https://pandastutor.com/index.html
往期精彩回顧
適合初學者入門人工智能的路線及資料下載(圖文+視頻)機器學習入門系列下載機器學習及深度學習筆記等資料打印《統計學習方法》的代碼復現專輯機器學習交流qq群955171419,加入微信群請掃碼