程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

Python read doc and docx

編輯:Python
from docx import Documentimport osfrom win32com import clientfile_name="D:/BaiduNetdiskDownload/Summary of copywriting"file_list=os.listdir(file_name)data_list=[]for one_file in file_list:dir_file_name=file_name+"/"+one_filedata_list.append(one_file+"\r")if "docx" in dir_file_name:try:data=Document(dir_file_name)data_list+=[i.text.strip()+"\r" for i in data.paragraphs]except:print()else:word = client.Dispatch("Word.Application")# print("Processed files: "+files[0])# open a filetry:doc = word.Documents.Open(dir_file_name)doc.SaveAs("{}x".format(dir_file_name), 12) # 12 means docx formatdoc.Close()os.remove(dir_file_name)except:print("No normal")with open("25.txt","w",encoding="utf-8") as f:f.writelines(data_list)

  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved