程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

python open函數中newline參數實例詳解

編輯:Python

目錄

問題的由來

具體實例

總結

問題的由來

我在讀pythoncsv模塊文檔 看到了這樣一句話

如果 csvfile 是文件對象,則打開它時應使用 newline=‘’。
其備注:如果沒有指定 newline=‘’,則嵌入引號中的換行符將無法正確解析,並且在寫入時,使用 \r\n 換行的平台會有多余的 \r 寫入。由於 csv 模塊會執行自己的(通用)換行符處理,因此指定 newline=‘’ 應該總是安全的。

我就在思考open函數中的newline參數的作用,因為自己之前在使用open函數時從來沒有設置過newline參數,僅從上面官方給的備注理解newline參數可以幫助處理換行符解析的問題

並且查閱得知不同操作系統換行符並不一致:

Unix 的行結束約定 ‘\n’、Windows 的約定 ‘\r\n’ 以及舊版 Macintosh 的約定 ‘\r’

打破了我原本觀念以為的換行符就是\n

python官方文檔對newline參數解釋:

newline 控制 universal newlines 模式如何生效(它僅適用於文本模式)。它可以是 None,‘’,‘\n’,‘\r’ 和 ‘\r\n’。它的工作原理:
從流中讀取輸入時,如果 newline 為 None,則啟用通用換行模式。輸入中的行可以以 ‘\n’,‘\r’ 或 ‘\r\n’ 結尾,這些行被翻譯成 ‘\n’ 在返回呼叫者之前。如果它是 ‘’,則啟用通用換行模式,但行結尾將返回給調用者未翻譯。如果它具有任何其他合法值,則輸入行僅由給定字符串終止,並且行結尾將返回給未調用的調用者。
將輸出寫入流時,如果 newline 為 None,則寫入的任何 ‘\n’ 字符都將轉換為系統默認行分隔符 os.linesep。如果 newline 是 ‘’ 或 ‘\n’,則不進行翻譯。如果 newline 是任何其他合法值,則寫入的任何 ‘\n’ 字符將被轉換為給定的字符串。

從這也就理解了為什麼原本使用open()寫的時候用\n就可以表示換行以及讀文本文件時行尾會返回\n

寫入的時候沒有指定newline參數會將\n翻譯成系統默認的行分割符(\r\n)

讀的時候沒有指定newline參數會將行分割符(\r\n)翻譯為\n

回到上文,那為什麼在讀寫csv文件時就要設置newline=''呢?

pythoncsv官方文檔解釋了這一問題(這也就引入了第二種方法解決換行的問題,我在後面會介紹到)

Dialect.lineterminator
放在 writer 產生的行的結尾,默認為 ‘\r\n’。
注解 reader 經過硬編碼,會識別 ‘\r’ 或 ‘\n’ 作為行尾,並忽略 lineterminator。未來可能會更改這一行為。

用白話說就是writerow()方法在寫入一行數據時在行尾都會跟一個默認換行符(\r\n)(即csv是將’一行數據\r\n’寫入內存,此時這一行數據還在內存中,還沒有寫入文件)之後執行代碼真正在向文件寫入時根據不同newline參數進行翻譯
而在向txt文件使用write()方法寫入內容時是我們手動添加換行符\n(內存中的數據就是我們寫入的內容,並不會隱式添加其他內容)之後執行代碼真正在向文件寫入時根據newline參數進行翻譯,這就是二者的區別
具體流程:
newline=‘’
writer.writerow(‘line’) 實際是向內存中寫入’line\r\n’ --》 執行代碼,寫入文件,根據newline=‘’,將不進行翻譯 --》文件最終寫入’line\r\n’
newline=None(默認)
f.write(‘line\n’) 直接將’line\n’寫入內存 --》 執行代碼,寫入文件,根據newline=None,將\n翻譯為\r\n --》文件最終寫入’line\r\n’

具體實例

case1: w newline=‘’ r newline=‘’

import csvwith open("test.csv","w",encoding='utf-8',newline='') as csvfile: writer=csv.writer(csvfile) writer.writerow(["num","name","grade"]) writer.writerows([[1,'luke','96'],[2,'jack','85'],[3,'nick','84']])with open("test.csv","r",encoding='utf-8',newline='') as csvfile: txtdata=csvfile.read()txtdata #>>'num,name,grade\r\n1,luke,96\r\n2,jack,85\r\n3,nick,84\r\n'

case2: w newline=‘\r’ r newline=‘’

import csvwith open("test.csv","w",encoding='utf-8',newline='\r') as csvfile: writer=csv.writer(csvfile) writer.writerow(["num","name","grade"]) writer.writerows([[1,'luke','96'],[2,'jack','85'],[3,'nick','84']])with open("test.csv","r",encoding='utf-8',newline='') as csvfile: txtdata=csvfile.read()txtdata #>>'num,name,grade\r\r1,luke,96\r\r2,jack,85\r\r3,nick,84\r\r'

case3: w newline=‘\r\n’ r newline=‘’

import csvwith open("test.csv","w",encoding='utf-8',newline='\r\n') as csvfile: writer=csv.writer(csvfile) writer.writerow(["num","name","grade"]) writer.writerows([[1,'luke','96'],[2,'jack','85'],[3,'nick','84']])with open("test.csv","r",encoding='utf-8',newline='') as csvfile: txtdata=csvfile.read()txtdata #>>'num,name,grade\r\r\n1,luke,96\r\r\n2,jack,85\r\r\n3,nick,84\r\r\n'

case4: w newline=None r newline=None

import csvwith open("test.csv","w",encoding='utf-8',newline=None) as csvfile: writer=csv.writer(csvfile) writer.writerow(["num","name","grade"]) writer.writerows([[1,'luke','96'],[2,'jack','85'],[3,'nick','84']])with open("test.csv","r",encoding='utf-8',newline=None) as csvfile: txtdata=csvfile.read()txtdata #>>'num,name,grade\n\n1,luke,96\n\n2,jack,85\n\n3,nick,84\n\n'

case5: 文件寫入為\r\r\n 文件讀取 newline=‘\r’

with open("test.csv","r",encoding='utf-8',newline='') as csvfile:txtdata=csvfile.read()txtdata #>>'num,name,grade\r\r\n1,luke,96\r\r\n2,jack,85\r\r\n3,nick,84\r\r\n'import csvwith open("test.csv","r",encoding='utf-8',newline='\r') as csvfile: content = csv.reader(csvfile) for i in content: print(i)

為什麼會報錯:

csv.reader是如何讀取\r\r\n的:讀取時遇到\r認為一行結束了,再一次遇到\r同樣認為一行結束(因而返回了空串列表),遇到\n無法解釋–》報錯

case6:文件寫入為\r\r\n 文件讀取 newline=‘\n’

with open("test.csv","r",encoding='utf-8',newline='') as csvfile: txtdata=csvfile.read()txtdata #>>'num,name,grade\r\r\n1,luke,96\r\r\n2,jack,85\r\r\n3,nick,84\r\r\n'import csvwith open("test.csv","r",encoding='utf-8',newline='\n') as csvfile: content = csv.reader(csvfile) for i in content: print(i)

case7:文件寫入為\r\r\n 文件讀取newline=‘\r\n’

with open("test.csv","r",encoding='utf-8',newline='') as csvfile: txtdata=csvfile.read()txtdata #>>'num,name,grade\r\r\n1,luke,96\r\r\n2,jack,85\r\r\n3,nick,84\r\r\n'import csvwith open("test.csv","r",encoding='utf-8',newline='\r\n') as csvfile: content = csv.reader(csvfile) for i in content: print(i)

case8:文件寫入為\r\r 文件讀取 newline=‘\r’

with open("test.csv","r",encoding='utf-8',newline='') as csvfile: txtdata=csvfile.read()txtdata #>>'num,name,grade\r\r1,luke,96\r\r2,jack,85\r\r3,nick,84\r\r'import csvwith open("test.csv","r",encoding='utf-8',newline='\r') as csvfile: content = csv.reader(csvfile) for i in content: print(i)

第二種方法:通過設置csv.writer方法中的lineterminator參數

上面提到lineterminator參數控制writer寫入每一行後跟的隱式結束符,默認為’\r\n’,因此我們需要要設置lineterminator=‘\n’,讀取時也不需要設置newline參數即可獲得想要的效果

import csvwith open("test.csv","w",encoding='utf-8') as csvfile: writer=csv.writer(csvfile,lineterminator='\n') writer.writerow(["num","name","grade"]) writer.writerows([[1,'luke','96'],[2,'jack','85'],[3,'nick','84']])with open("test.csv","r",encoding='utf-8') as csvfile: lst=csv.reader(csvfile) csvfile.seek(0) txtdata = csvfile.read() csvfile.seek(0) for i in lst: print(i)txtdata #>>'num,name,grade\n1,luke,96\n2,jack,85\n3,nick,84\n'

總結

到此這篇關於python open函數中newline參數實例詳解的文章就介紹到這了,更多相關python open函數newline參數內容請搜索軟件開發網以前的文章或繼續浏覽下面的相關文章希望大家以後多多支持軟件開發網!



  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved