本文總結了pandas的常用操作,並做成練習題,練習題附答案,並且有完整數據集,建議讀者把練習題完成。作者認為,做完練習題,pandas的基本操作沒有問題了,以後碰到問題也可以查這些習題。(文末提供下載)
Pandas 是基於NumPy 的一種工具,該工具是為了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標准的數據模型,提供了高效地操作大型數據集所需的工具。pandas提供了大量能使我們快速便捷地處理數據的函數和方法。你很快就會發現,它是使Python成為強大而高效的數據分析環境的重要因素之一。
網上可以搜到大量的pandas教程和官方文檔,但沒有簡單的方法來練習。教程是很好的資源,但要付諸實踐。 只有實踐,才能更好的加深學習。
本站從github搜索到了一些pandas的練習題,含完整數據集,並進行整理:
原代碼作者:Guilherme Samora
本練習代碼可以在github下載:
https://github.com/fengdu78/machine_learning_beginner/tree/master/pandas/Pandas_Exercises
Pandas練習題目錄
1.Getting and knowing
2.Filtering and Sorting
3.Grouping
4.Apply
5.Merge
6.Stats
7.Visualization
8.Creating Series and DataFrames
9.Time Series
10.Deleting
使用方法
每個練習文件夾有三個不同類型的文件:
1. Exercises.ipynb
沒有答案代碼的文件,這個是你做的練習
2.Solutions.ipynb
運行代碼後的結果(不要改動)
3.Exercise_with_Solutions.ipynb
有答案代碼和注釋的文件
你可以在Exercises.ipynb裡輸入代碼,看看運行結果是否和Solutions.ipynb裡面的內容一致,如果真的完成不了再看下Exercise_with_Solutions.ipynb的答案。
典型的例題如圖所示:
練習題截圖
總結
本文把pandas的常用操作做成練習題,練習題附答案,並且有完整數據集。希望初學者能認真完成練習題,以便提高數據分析技能。
本練習代碼可以在github下載:
https://github.com/fengdu78/machine_learning_beginner/tree/master/pandas/Pandas_Exercises
請關注和分享↓↓↓
機器學習初學者
QQ群:554839127