圖片和文字是word文檔中兩種最常見的對象,在微軟word中,如果我們想要提取出一個文檔內的圖片,只需要右擊圖片選擇另存為然後命名保存就可以了,今天這篇文章主要是實現如何使用C#從Word文檔中提取圖片。
這裡我准備了一個含有文字和圖片的Word文檔:
詳細步驟與代碼:
步驟1 : 添加引用。
新建一個Visual C#控制台項目,添加引用並使用如下命名空間:
? 1 2 3 4using
System;
using
Spire.Doc;
using
Spire.Doc.Documents;
using
Spire.Doc.FIElds;
步驟2 : 新建一個word文檔對象並加載需要提取圖片的Word文檔。
Document document = new Document("法國景點.docx ");
步驟3 : 遍歷文檔中的所有section,找到圖片,將它們提取出來並保存。
? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23int
index = 0;
//獲取文檔的section
foreach
(Section section
in
document.Sections)
{
//獲取section中的段落
foreach
(Paragraph paragraph
in
section.Paragraphs)
{
//獲取段落中的文檔對象
foreach
(DocumentObject docObject
in
paragraph.ChildObjects)
{
//對對象的type進行判斷,如果是圖片,就提取出來
if
(docObject.DocumentObjectType == DocumentObjectType.Picture)
{
DocPicture picture = docObject
as
DocPicture;
//給圖片命名
String imageName = String.Format(
@"images\Image-{0}.png"
, index);
//保存圖片
picture.Image.Save(imageName, System.Drawing.Imaging.ImageFormat.Png);
index++;
}
}
}
}
提取出來的圖片:
全部代碼:
? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32using
System;
using
Spire.Doc;
using
Spire.Doc.Documents;
using
Spire.Doc.FIElds;
using
System.Drawing;
namespace
Extract_image_from_Word
{
class
Program
{
static
void
Main(
string
[] args)
{
Document document =
new
Document(
"法國景點.docx"
);
int
index = 0;
foreach
(Section section
in
document.Sections)
{
foreach
(Paragraph paragraph
in
section.Paragraphs)
{
foreach
(DocumentObject docObject
in
paragraph.ChildObjects)
{
if
(docObject.DocumentObjectType == DocumentObjectType.Picture)
{
DocPicture picture = docObject
as
DocPicture;
String imageName = String.Format(
@"images\Image-{0}.png"
, index);
picture.Image.Save(imageName, System.Drawing.Imaging.ImageFormat.Png);
index++;
}
}
}
}
}
}
}
總結:
這裡我使用的是E-iceblue公司的免費 Word 組件,它除了可以從文檔中提取圖片,還可以提取文本,這裡我只寫了提取圖片的,提取文本的也差不多,如有需要可以留言。