前面的章節關注於不同類型的數據規整流程和NumPy、pandas與其它庫的特點。隨著時間的發展,pandas發展出了更多適合高級用戶的功能。本章就要深入學習pandas的高級功能。
這一節介紹的是pandas的分類類型。我會向你展示通過使用它,提高性能和內存的使用率。我還會介紹一些在統計和機器學習中使用分類數據的工具。
表中的一列通常會有重復的包含不同值的小集合的情況。我們已經學過了unique和value_counts,它們可以從數組提取出不同的值,並分別計算頻率:
In [10]: import numpy as np; import pandas as pd
In [11]: values = pd
Hey, everyone, good duck ! Im
PDF(Portable Document Format)
The basic principle of binocul