程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> JAVA編程 >> 關於JAVA >> 淺談Java讀取Csv實踐

淺談Java讀取Csv實踐

編輯:關於JAVA

Csv文件,逗號分隔的常用數據文件格式,默認可以用Office軟件打開。

維基百科對CSV的詳細描述:

http://zh.wikipedia.org/wiki/CSV

看項目中以前的處理方式是直接用用Java IO類庫讀取Csv文件,實際處理中發現Csv文件本身包含了對各種特殊字符的處理信息。最常見的比如:

1. 對包含特殊字符的字符串數據首尾加雙引號

2. 對數據中的單個雙引號前加單個雙引號

其它...

所以用Java IO讀到的字符串全是經過處理後的字符串,在某些場景下是不符合預期需求的。比如我需要的是不做任何處理的原始內容。

項目中另一種常見的文件格式Excel用了POI來處理,但是POI不支持Csv格式,於是找到了Javacsv。

代碼很簡單:

Java代碼

  1. public List importCsv(String file) {
  2. List list = new ArrayList();
  3. CsvReader reader = null;
  4. try {
  5. //初始化CsvReader並指定列分隔符和字符編碼
  6. reader = new CsvReader(file, ',', Charset.forName("GBK"));
  7. while (reader.readRecord()) {
  8. //讀取每行數據以數組形式返回
  9. String[] str = reader.getValues();
  10. if (str != null && str.length > 0) {
  11. if (str[0] != null && !"".equals(str[0].trim())) {
  12. list.add(str);
  13. }
  14. }
  15. }
  16. } catch (FileNotFoundException e) {
  17. log.error("Error reading csv file.",e);
  18. } catch (IOException e) {
  19. log.error("",e);
  20. }
  21. finally{
  22. if(reader != null)
  23. //關閉CsvReader
  24. reader.close();
  25. }
  26. return list;
  27. }

以上代碼有幾個要點:

1 初始化CsvReader時指定分隔符和字符編碼,如果不指定,默認分別為逗號和ISO-8859-1,我用了GBK,具體使用時要看當時的字符編碼而定。

2 讀取每行數據,返回字符串數組,數組內的順序即文件數據列的順序

3 最後記得關閉CsvReader

是不是很簡單,返回的數組格式也正好是我想要的,而且拿到是原始的數據,沒有經過特殊字符處理。

有些童鞋質疑特殊字符未經處理,插到數據庫會出錯,其實大可不必我們手工處理,一些基礎組件比如JDBC的preparedstatement已經包含了對特殊字符的處理,我們只要以綁定參數的形式來傳送這些包含特殊字符的數據就可以。常用的持久化框架底層也封裝了JDBC,自然也對特殊字符做了處理。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved