在編寫文本文件讀寫程序的過程中,有如下代碼
StreamReader sr = new StreamReader(FileName);
結果發現打開中文文本文件出現亂碼。
究其原因,原來自從Windows 2000之後的操作系統在文件處理時默認編碼采用Unicode,所以.Net 的文件默認編碼也是Unicode。除非另外指定,StreamReader 的默認編碼為 Unicode,而不是當前系統的 ANSI 代碼頁。但是文檔大部分還是以ANSI編碼儲存,中文文本使用的是gb2312,所以才造成中文亂碼的狀況,也就是說在讀取文本的時候要指定編碼格式。
但是問題來了,System.Text.Encoding 裡面一堆編碼格式ASCII、UTF-8等等,要選哪一個好?
其實很簡單,用
System.Text.Encoding.Default 告訴
StreamReader 目前操作系統的編碼即可。
StreamReader reader = new StreamReader(FileName, System.Text.Encoding.Default)