有份 EXCEL 文件無法用jxl和poi解析。poi解析時報錯:
Exception in thread "main" java.io.IOException: Invalid header signature; read 0x7265562D454D494D, expected 0xE11AB1A1E011CFD0
後來網上一查這個錯,知道這個Excel文件 原來是一個mht/mhtml格式的文件,當然解析不了,可以通過打開這個Excel,在另存為Excel97-2003工作薄解決。
問題來了:
現在這些Excel是別人第三方平台批量生成的,來到我們這邊的時候數量很龐大,不可能逐個點開另存為;當我想以解析html的方式解析這些Excel時,打開後發現其中裡面的信息是這樣的:
=E4=B8=9C=E6=96=B9=E6=97=A5=E5=8D=87=EF=BC=88300118=EF=BC=89=EF=BC=9A=E5=B8=83=E5=B1=80=E7=94=B5=E7=AB=99=E8=BF=90=E7=BB=B4=EF=BC=8C=E5=AE=8C=E5=96=84=E8=83=BD=E6=BA=90=E4=BA=92=E8=81=94=E7=BD=91=E6=88=98=E7=95=A5
=E4=B8=9C=E6=96=B9=E6=97=A5=E5=8D=87
=E9=95=BF=E6=B1=9F=E8=AF=81=E5=88=B8
=E9=82=AC=E5=8D=9A=E5=8D=8E
這是一種編碼,過去常用於電子郵件。MIME