使用OLEDB可以對excel文件進行讀取,我們只要把該excel文件作為數據源即可。
一 在D盤創建excel文件test.xls:
二 將工作表Sheet1的內容讀取到DataSet
復制代碼 代碼如下:
string strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+
"Extended Properties='Excel 8.0'";
DataSet ds = new DataSet();
OleDbDataAdapter oada = new OleDbDataAdapter("select * from [Sheet1$]", strConn);
oada.Fill(ds);
讀取的DataSet為:
從圖中可以看出excel文件中的第一行變成了DataSet中的列名,這正是系統的默認設置。
三 如果想把第一行也作為數據行,那我們可以給連接字符串添加一個HDR=No屬性如:
復制代碼 代碼如下:
string strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+
"Extended Properties='Excel 8.0;HDR=No'";
DataSet ds = new DataSet();
OleDbDataAdapter oada = new OleDbDataAdapter("select * from [Sheet1$]", strConn);
oada.Fill(ds);
結果也許會讓你有點想不到:
第一行的第一列和第三列都變成空的了,這是因為系統把第一列識別成了數字,把第三列識別成了日期,
而第一行的數據不符合格式的要求,所以就變成空的了。
四 我們還可以把所有列都做為字符串來讀取,只要添加屬性IMEX=1即可
復制代碼 代碼如下:
string strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+
"Extended Properties='Excel 8.0;HDR=No;IMEX=1'";
DataSet ds = new DataSet();
OleDbDataAdapter oada = new OleDbDataAdapter("select * from [Sheet1$]", strConn);
oada.Fill(ds);
結果又會如何呢?
是不是再次出乎你的意料,第三行的日期怎麼變成數字了,其實excel在轉換格式的時候就自動把日期變成數字了,
那這個數字是怎麼來的呢 ? 如果你把日期改成1900年1月1日,那麼你可以看到他的轉換結果是1,以此類推,39902是哪一天就明白了吧。
這裡解決辦法:
方法一:
復制代碼 代碼如下:
public static string getDateStr(string strValue)
{
int i = Convert.ToInt32(strValue);
DateTime d1 = Convert.ToDateTime("1900-1-1");
DateTime d2 = d1.AddDays(i - 2);
string strTemp = d2.ToString("d");
return strTemp;
}
方法二:
復制代碼 代碼如下:
DateTime.FromOADate(Convert.ToInt32(strValue)).ToString("d");
五 也許你並不想讀取整個excel的內容
如果只想讀取前兩列可以用:select * from [Sheet1$A:B]
如果只想讀取A1到B2的內容,就用:select * from [Sheet1$A1:B2]
六 如果不知道工作表的名字或名字被人為修改了該怎麼辦呢?
我們可以通過索引來獲取指定工作表的名字,以下方法可以用來獲取工作表名稱的數組:
復制代碼 代碼如下:
ArrayList al = new ArrayList();
string strConn;
strConn = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=D:/test.xls;"+
"Extended Properties=Excel 8.0;";
OleDbConnection conn = new OleDbConnection(strConn);
conn.Open();
DataTable sheetNames = conn.GetOleDbSchemaTable
(OleDbSchemaGuid.Tables, new object[] { null, null, null, "TABLE" });
conn.Close();
foreach (DataRow dr in sheetNames.Rows)
{
al.Add(dr[2]);
}
return al;
IMEX=1的時候並不是全都會作為字符串來處理,根據系統的默認設置,通常如果前8行有字符串,則該列會作為字符串來處理,如果全都為數字,則該列為數字列,日期也是一樣。
如果你覺得8行不夠或者太多了,則只能修改注冊表HKEY_LOCAL_MACHINE/Software/Microsoft/Jet/4.0/Engines/Excel/TypeGuessRows,如果此值為0,則會根據所有行來判斷使用什麼類型,通常不建議這麽做,除非你的數據量確實比較少。
無法讀取EXCEL中的數據單元格。有數據,但是讀出來全是空值。
解決方法:
1.在導入數據連接字符串中,將IMEX=1加入,“Provider=Microsoft.Jet.OLEDB.4.0;Data Source="C:\Data.xls";Extended Properties="Excel 8.0;HDR=Yes;IMEX=1; ”,這樣就可以。
注:
“HDR=Yes;”指示第一行中包含列名,而不是數據;
“IMEX=1;”通知驅動程
序始終將“互混”數據列作為文本讀取。
兩者必須一起使用。
本以為這樣就OK了。但在實際使用過程中,這樣設置還是不行,查閱了不少資料才發現,原來還有一個注冊表裡的信息需要修改,這樣帶能讓excel不再使用前8行的內容來確定該列的類型。
注冊表修改內容如下:
在HKEY_LOCAL_MACHINE\Software\Microsoft\Jet\4.0\Engines\Excel有一個TypeGuessRows值,預設是8,表示會先讀取前8列來決定每一個欄位的型態,所以如果前8列的資料都是數字,到了第9列以後出現的文字資料都會變成null,所以如果要解決這個問題,只要把TypeGuessRows機碼值改成0,就可以解這個問題了。