來源:https://pandastutor.com/index.html
Pandas
是數據挖掘常見的工具,掌握使用過程中的函數是非常重要的。本文將借助可視化的過程,講解Pandas
的各種操作。
(dogs[dogs['size'] == 'medium']
.sort_values('type')
.groupby('type').median()
)
執行步驟:
size列篩選出部分行
然後將行的類型進行轉換
按照type列進行分組,計算中位數
dogs['longevity']
dogs.groupby('size').mean()
執行步驟:
將數據按照size進行分組
在分組內進行聚合操作
dogs.groupby(['type', 'size'])
(dogs
.sort_values('size')
.groupby('size')['height']
.agg(['sum', 'mean', 'std'])
)
執行步驟
按照size列對數據進行排序
按照size進行分組
對分組內的height進行計算
df.loc[:, df.loc['two'] <= 20]
dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']
dogs.drop(columns=['type'])
ppl.join(dogs)
ppl.merge(dogs, left_on='likes', right_on='breed', how='left')
dogs.pivot_table(index='size', columns='kids', values='price')
dogs.melt()
dogs.pivot(index='size', columns='kids')
dogs.stack()
dogs.unstack()
dogs.reset_index()
dogs.set_index('breed')
往期回顧
Matplotlib繪制圓環圖的兩種方法!
13個python必備的知識,建議收藏!
趣味十足的Python可視化技巧!
低代碼走出半生,歸來仍是"毒瘤"!
分享
點收藏
點點贊
點在看