創建DataFrame對象
pd.DataFrame(data=None,index=None,columns=None,dtype=None,copy=None)
使用嵌套列表創建:
指定數值元素的數據類型為float
注:dtype只能設置一個,設置多個列的數據類型,需要使用其他方式
列表嵌套字典創建DataFrame對象:列表嵌套字典可以作為輸入數據傳遞給DataFrame構造函數。默認情況下,字典的key被用作列名
注:如果其中某個元素值缺失,也就是字典的key無法找到對應的value,將使用NaNcy代替
Series創建DataFrame對象(字典對應的值是Series):可以傳遞一個字典形式的Series,從而創建一個DataFrame對象,其輸出結果的行索是所有index合集
注:對於one列而言,此處雖然顯示了行索引‘d’,但由於沒有與其對應的值,所以他的值為NaN
添加自定義的行標簽(字典的對應值是列表):
9.列操作DataFrame:DataFrame可以使用列標簽來完成數據的選取、添加和刪除操作
(1)選取數據列
可以使用列索引,輕松實現數據選取
(df不能使用切片選取多列,也不可以直接通過標簽位置去獲取列)
(2)列添加
使用columns列索引標簽可以實現添加新的數據列
注:除此之外,還可以使用inset()方法插入新的列:df.insert(loc,column,value,allow_duplicates=False)
eg.
(3)刪除數據列:通過del和pop()都能刪除DataFrame中的數據列,pop有返回值
10.行操作DataFrame:
(1)標簽選取:
行操作需要借助loc屬性來完成:按標簽或布爾數組訪問一組行和列
注:loc允許接受兩個參數分別是行和列
行和列還可以使用切片