df.groupby(
by=None,
axis=0,
level=None,
as_index: bool = True,
sort: bool = True,
group_keys: bool = True,
squeeze: bool = False,
observed: bool = False,
)
字典中的鍵不需要包含所有的index,也可以包含index中沒有的鍵
作為分組鍵傳遞的函數將會按照每個索引值調用一次,同時返回值會被用作分組名稱。
pandas按照列groupby後,可以按照值取對應的group。
當對多列進行groupby時,get_group時需要輸入多列值的tuple,比如get_group((‘a’, 1)),其中’a’為第一個group列中的某個值,1為第二個group列中的某個值。
import pandas as pd
df = pd.DataFrame({
'col1':['a', 'b', 'c','a', 'b', 'c'], 'col2':[1,2,3,4,5,6]})
df
>>> col1 col2
0 a 1
1 b 2
2 c 3
3 a 4
4 b 5
5 c 6
df.groupby('col1').get_group('a')
>>> col1 col2
0 a 1
3 a 4
df.groupby(['col1', 'col2']).get_group(('a', 1))
>>> col1 col2
0 a 1