程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

【pandas】1、Series 與 DaraFrame

編輯:Python

目錄

  • 1、Series
    • 1、使用 列表 創建 Series
    • 2)使用 字典 創建 Series
    • 3)創建 Series,指定索引和名稱
    • 4)使用 索引 讀取數據
  • 2、DaraFrame
    • 1)使用 列表 創建 DataFrame
    • 2)使用 字典 創建 DataFrame
    • 3)創建 DataFrame 時,指定索引
    • 4)使用 loc 讀取指定行的數據

1、Series

Pandas Series 類似表格中的一個列(column),類似於一維數組,可以保存任何數據類型。

pandas.Series( data, index, dtype, name, copy)

參數說明:

  • data:一組數據(ndarray 類型)。
  • index:數據索引標簽,如果不指定,默認從 0 開始。
  • dtype:數據類型,默認會自己判斷。
  • name:設置名稱。
  • copy:拷貝數據,默認為 False。

1、使用 列表 創建 Series

import pandas as pd
students = ['Sam', 'Enzo', 'Lily']
myclass = pd.Series(students)
print(myclass)


從上圖可知,如果沒有指定索引,索引值就從 0 開始


2)使用 字典 創建 Series

import pandas as pd
students = {
'name1':'Sam', 'name2':'Enzo', 'name3':'Lily'}
myclass = pd.Series(students, name='class')
print(myclass)


從上圖可知,字典的 key 變成了索引值

如果只需要字典中的一部分數據,通過 index 指定就好了

import pandas as pd
students = {
'name1':'Sam', 'name2':'Enzo', 'name3':'Lily'}
myclass = pd.Series(students, index=['name1', 'name3'], name='class')
print(myclass)


3)創建 Series,指定索引和名稱

import pandas as pd
students = ['Sam', 'Enzo', 'Lily']
index = ['name1', 'name2', 'name3']
myclass = pd.Series(students, index=index, name='class')
print(myclass)


4)使用 索引 讀取數據

import pandas as pd
students = ['Sam', 'Enzo', 'Lily']
index = ['name1', 'name2', 'name3']
myclass = pd.Series(students, index=index, name='class')
print(myclass['name2'])
print(myclass[1:3])


2、DaraFrame

DataFrame 是一個表格型的數據結構,它含有一組有序的列,每列可以是不同的值類型(數值、字符串、布爾型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 拼接而成

pandas.DataFrame( data, index, columns, dtype, copy)

參數說明:

  • data:一組數據(ndarray、series, map, lists, dict 等類型)。
  • index:索引值,或者可以稱為行標簽。
  • columns:列標簽,默認為 RangeIndex (0, 1, 2, …, n) 。
  • dtype:數據類型。
  • copy:拷貝數據,默認為 False。

1)使用 列表 創建 DataFrame

import pandas as pd
data = [['Google',10],
['Runoob',12],
['Wiki',13]]
df = pd.DataFrame(data,columns=['Site','Age'])
print(df)


2)使用 字典 創建 DataFrame

寫法一:

import pandas as pd
data = {
'Site':['Google', 'Runoob', 'Wiki'],
'Age':[10, 12, 13]}
df = pd.DataFrame(data)
print (df)

寫法二:

import pandas as pd
data = [{
'Site': 'Google'},{
'Site': 'Runoob', 'Age': 12}]
df = pd.DataFrame(data)
print (df)


3)創建 DataFrame 時,指定索引

import pandas as pd
data = {
'calories':[420, 380, 390],
"duration":[50, 40, 45]}
df = pd.DataFrame(data, index = ["day1", "day2", "day3"])
print(df)


4)使用 loc 讀取指定行的數據

import pandas as pd
data = {
'calories':[420, 380, 390],
"duration":[50, 40, 45]}
df = pd.DataFrame(data)
print(df.loc[0])
print('\n')
print(df.loc[2])

注意:返回結果其實就是一個 Pandas Series 數據。


也可以一次讀取多行數據,注意是使用 [[ … ]] 格式,不是 [… ]

import pandas as pd
data = {
'calories':[420, 380, 390], "duration":[50, 40, 45]}
df = pd.DataFrame(data)
print(df.loc[[0, 2]])


自定義索引時,使用 loc 指定索引值,讀取對應的行

import pandas as pd
data = {

"calories": [420, 380, 390],
"duration": [50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2", "day3"])
print(df.loc["day1"])
print('\n')
print(df.loc[["day1", "day3"]])


  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved