目錄
- 一、pandas簡介
- 二、Series
- 1 - Series簡介
- 2 - Series創建
- 3 - Series的索引和切片
- 4 - Series常用屬性
- 5 - Series常用方法
- 三、DataFrame
- 1 - Dataframe簡介
- 2 - DataFrame創建
- 3 - DataFrame的屬性
- 4 - DataFrame索引
- 5 - DataFrame切片
- 6 - 時間數據類型的轉換
- 7 - 將某一列設置為行索引
- 四、jupyter筆記
一、pandas簡介
- 為什麼學習pandas:numpy已經可以幫助我們進行數據的處理了,那麼學習pandas的目的是什麼呢?
- numpy能夠幫助我們處理的是數值型的數據,當然在數據分析中除了數值型的數據還有好多其他類型的數據(字符串,時間序列),那麼pandas就可以幫我們很好的處理除了數值型的其他數據
- pandas中常用的兩個類
二、Series
1 - Series簡介
- 什麼是Series:Series是一種類似與一維數組的對象,由下面兩個部分組成
- values:一組數據(ndarray類型)
- index:相關的數據索引標簽
2 - Series創建
3 - Series的索引和切片
4 - Series常用屬性
- Series常用屬性
- shape:形狀
- size:元素個數
- index:返回索引
- values:返回值
- dtype:元素的類型
5 - Series常用方法
- 常用方法
- head(),tail()
- unique()
- isnull(),notnull()
- add() sub() mul() div()
三、DataFrame
1 - Dataframe簡介
- 什麼是DataFrame:DataFrame是一個【表格型】的數據結構。DataFrame由按一定順序排列的多列數據組成。設計初衷是將Series的使用場景從一維拓展到多維。DataFrame既有行索引,也有列索引
- DataFrame結構:可以形象的理解為數據庫中的表
- 行索引:index
- 列索引:columns
- 值:values
2 - DataFrame創建
3 - DataFrame的屬性
- DataFrame常用屬性:values、columns、index、shape
- 練習:根據以下考試成績表,創建一個DataFrame,命名為df
張三 李四
語文 150 0
數學 150 0
英語 150 0
理綜 300 0
4 - DataFrame索引
- 取單行、取多行
- loc和iloc的區別:參考資料
- iloc:通過隱式索引取行
- loc:通過顯式索引取行
- 取單個元素、取多個元素
5 - DataFrame切片
對行、列進行切片
練習:索引切片:
- ①.假設ddd是期中考試成績,ddd2是期末考試成績,請自由創建ddd2,並將其與ddd相加,求期中期末平均值
- ②.假設張三期中考試數學被發現作弊,要記為0分,如何實現?
- ③.李四因為舉報張三作弊立功,期中考試所有科目加100分,如何實現?
- ④.後來老師發現有一道題出錯了,為了安撫學生情緒,給每位學生每個科目都加10分,如何實現?
DataFrame的運算規則同Series
6 - 時間數據類型的轉換
7 - 將某一列設置為行索引
四、jupyter筆記
點擊下載jupyter筆記