來源
https://pandastutor.com/index.html
大家好,我是俊欣。
Pandas
是數據挖掘常見的工具,掌握使用過程中的函數是非常重要的。本文將借助可視化的過程,講解Pandas
的各種操作。
(dogs[dogs['size'] == 'medium']
.sort_values('type')
.groupby('type').median()
)
執行步驟:
size列篩選出部分行
然後將行的類型進行轉換
按照type列進行分組,計算中位數
dogs['longevity']
dogs.groupby('size').mean()
執行步驟:
將數據按照size進行分組
在分組內進行聚合操作
dogs.groupby(['type', 'size'])
(dogs
.sort_values('size')
.groupby('size')['height']
.agg(['sum', 'mean', 'std'])
)
執行步驟
按照size列對數據進行排序
按照size進行分組
對分組內的height進行計算
df.loc[:, df.loc['two'] <= 20]
dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']
dogs.drop(columns=['type'])
ppl.join(dogs)
ppl.merge(dogs, left_on='likes', right_on='breed', how='left')
dogs.pivot_table(index='size', columns='kids', values='price')
dogs.melt()
dogs.pivot(index='size', columns='kids')
dogs.stack()
dogs.unstack()
dogs.reset_index()
dogs.set_index('breed')
萬水千山總是情,點個 行不行。
【硬核干貨】Pandas模塊中的數據類型轉換
Python實現定時任務的八種方案,干貨滿滿
推薦7個常用的Pandas時間序列處理函數
一次性總結:64個數據分析常用術語!
小白也能看懂的圖解SQL基礎知識
數據分析師都了解的統計基本概念
··· END ···
分享、收藏、點贊、在看安排一下?