程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

Python可視化數據分析07、Pandas_CSV文件讀寫

編輯:Python

 ​編輯

Python可視化數據分析07、Pandas_CSV文件讀寫

前言

博客:【紅目香薰的博客_CSDN博客-計算機理論,2022年藍橋杯,MySQL領域博主】

本文由在下【紅目香薰】原創,首發於CSDN

2022年最大願望:【服務百萬技術人次】

Python初始環境地址:【Python可視化數據分析01、python環境搭建】 


環境需求

環境:win10

開發工具:PyCharm Community Edition 2021.2

數據庫:MySQL5.6

目錄

Python可視化數據分析07、Pandas_CSV文件讀寫

前言

環境需求


CSV文件

CSV文件操作

CSV寫入

CSV讀取



CSV文件

逗號分隔值(Comma-Separated Values,CSV,有時也稱為字符分隔值,因為分隔字符也可以不是逗號),其文件以純文本形式存儲表格數據(數字和文本)。

CSV文件操作

在Pandas模塊中,使用to_csv()函數將DataFrame對象寫入到CSV文件。
to_csv()函數的參數說明如下:
path_or_buf:字符串或文件句柄,默認無文件路徑或對象,如果沒有提供,結果將返回為字符串。可以是URL,可用URL類型包括http、ftp、s3和文件。
sep:指定分隔符。如果不指定參數,則會嘗試使用逗號分隔。

CSV寫入

import pandas as pddf = pd.DataFrame({"id": [1, 2, 3], "name": ["雷靜", "小鳳", "春夢"], "age": ["21", "22", "20"]})print(df)# 寫入到csv文件df.to_csv("test.csv", index=False, sep=",", encoding="gbk") # 使用gbk在用excel的時候能顯示中文

編輯
import pandas as pddf = pd.DataFrame({"id": [1, 2, 3], "name": ["雷靜", "小鳳", "春夢"], "age": ["21", "22", "20"]})print(df)# 寫入到csv文件df.to_csv("test.csv", index=False, sep=",", encoding="utf-8") # 使用gbk在用excel的時候能顯示中文


​編輯

​編輯

CSV讀取

import pandas as pddf = pd.read_csv("test.csv", encoding="utf-8")print(df)

​編輯

import pandas as pddf = pd.read_csv("test.csv", encoding="gbk")# 基礎信息print(df.info)# 查看列名print(df.columns)# 查看各列數據類型print(df.dtypes)# 查看下標print(df.index)# 數據浏覽前2條print(df.head(2))# 查看name到age列print(df.loc[:, "name":"age"])# 基本統計print("最大年齡:", df.age.max())print("平均年齡:", df.age.mean())# 查詢print(df[df.name == "春夢"])# 排序·True正序False倒序print(df.sort_values(by=["age"], ascending=False))# 在第二列【下標是1】添加列df.insert(1, "sex", "女")print(df)# 在最後添加列df["introduce"] = "巾帼"print(df)# 刪除某行df = df.drop(1)print(df)# 替換value = pd.Series([1, "女", "雷靜靜", 20, "大眼姑娘"], index=["id", "sex", "name", "age", "introduce"])df.loc[0] = valuevalue = pd.Series([4, "女", "小龍女", 18, "冰山美人"], index=["id", "sex", "name", "age", "introduce"])df.loc[3] = valueprint(df)# 條數print(len(df))


<bound method DataFrame.info of    id name  age
0   1   雷靜   21
1   2   小鳳   22
2   3   春夢   20>
Index(['id', 'name', 'age'], dtype='object')
id       int64
name    object
age      int64
dtype: object
RangeIndex(start=0, stop=3, step=1)
   id name  age
0   1   雷靜   21
1   2   小鳳   22
  name  age
0   雷靜   21
1   小鳳   22
2   春夢   20
最大年齡: 22
平均年齡: 21.0
   id name  age
2   3   春夢   20
   id name  age
1   2   小鳳   22
0   1   雷靜   21
2   3   春夢   20
   id sex name  age
0   1   女   雷靜   21
1   2   女   小鳳   22
2   3   女   春夢   20
   id sex name  age introduce
0   1   女   雷靜   21        巾帼
1   2   女   小鳳   22        巾帼
2   3   女   春夢   20        巾帼
   id sex name  age introduce
0   1   女   雷靜   21        巾帼
2   3   女   春夢   20        巾帼
   id sex name  age introduce
0   1   女  雷靜靜   20      大眼姑娘
2   3   女   春夢   20        巾帼
3   4   女  小龍女   18      冰山美人
3

Process finished with exit code 0


  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved