將磁盤上的數據文件讀入Python數據結構,大多是使用pandas.read_csv
之類的高級工具。
為了打開一個文件以便讀寫,可以使用內置的open函數,以及一個相對或者絕對的文件路徑。
In [207]: path = 'examples/segismundo.txt'
In [208]: f = open(path)
默認情況下,文件是以只讀模式(’r’)
打開的。然後,我們就可以像處理列表那樣來處理這個文件句柄f了,比如對行進行迭代:
for line in f:
pass
由於從文件中取出的行都有行結束符(EOL),因此去掉EOL的方法如下:
In [209]: lines = [x.rstrip() for x in open(path)]
In [210]: lines
Out[210]:
['Sueña el rico en su riqueza,',
'que más cuidados le ofrece;',
'',
'sueña el pobre que padece',
'su miseria y su pobreza;',
'',
'sueña el que a medrar empieza,',
'sueña el que afana y pretende,',
'sueña el que agravia y ofende,',
'',
'y en el mundo, en conclusión,',
'todos sueñan lo que son,',
'aunque ninguno lo entiende.',
'']