python读取txt文件_python读取docx文件，就是如此简单

2023-08-05 18:22:28

扫码加入千人跳槽求职QQ群或微信圈子，每日都有全国招聘信息哦

中文编码问题总是让人头疼(尤其是mac本),想要用Python读取word中的内容。用open()经常报错,通过百度搜索+问身边小伙伴发现了Python有专门读取.docx的模块python_docx。本篇文章主要来解决一个读取docx文件的基本操作。希望感兴趣的小伙伴可以坚持看下去同时欢迎提出宝贵的意见让我们一起进步！

01：问题抛出与引入

import docxpath = "C:\\Users\\qin\\Desktop\\1.docx"file_object=open(path,'rb')print(file_object.read())#输出结果如下所示：b'PK\x03\x04\x14\x00\x06\x00\x08\x00\x00\x00!\x00J\xbc\x02qm\x01\x00\x00(\x06\x00\x00\x13\x00\x08\x02[Content_Types].xml \xa2\x04\x02(\xa0\.....

`一个很简单的docx文件,打印出来的结果却不是我们想要的。对此引入一个十分好用的docx模块,下面就详细介绍该模块的一些基本操作。`

02：安装docx模块

pip install python_docx

03：新建文档对象

import docxfrom docx import Document# 新建文档,并将其保存名为“test.docx”的文件document = Document()document.save('test.docx')

`04：添加文档内容`

import docxfrom docx import Documentfrom docx.shared import Inchesdocument = Document('C:\\Users\\qin\\Desktop\\1.docx')document.add_heading('I like python', 0)#插入标题：0表示样式为title标题document.add_heading('一级标题', level=1)#插入1级标题p = document.add_paragraph('Python是一种计算机程序设计语言 ')#插入段落document.add_picture('C:\\Users\\qin\\Desktop\\1.png', width=Inches(1.25)) #添加图片并指定宽度table = document.add_table(rows=1, cols=3)  #添加一个表格，每行三列hdr_cells = table.rows[0].cells  #获取第一行的单元格列表对象hdr_cells[0].text = 'ID'    #为每一个单元格赋值hdr_cells[1].text = 'Name'hdr_cells[2].text = 'Age'new_cells = table.add_row().cells #为表格添加一行new_cells[0].text = '1'new_cells[1].text = 'Tom'new_cells[2].text = '15'document.add_page_break()   #添加分页符

`05：保存文档内容`

名字相同则将修改的文件内容保存;名字不同则将修改的文件内容另存为。

import docxfrom docx import Documentdocument.save('C:\\Users\\qin\\Desktop\\1.docx')#保存document.save('C:\\Users\\qin\\Desktop\\2.docx')#另存为

06：

import docxfrom docx import Documentpath = "C:\\Users\\qin\\Desktop\\1.docx"document = Document(path)for paragraph in document.paragraphs:    print(paragraph.text)

07：

import docxfrom docx import Documentpath = "C:\\Users\\qin\\Desktop\\1.docx"document = Document(path)  # 读入文件tables = document.tables   # 获取文件中的表格集table = tables[0]  # 获取文件中的第一个表格for i in range(0, len(table.rows)):  # 从表格第一行开始循环读取表格数据    result = f'{(table.cell(i, 0).text):<5}' + "" + f'{(table.cell(i, 1).text):<5}' + "" + f'{(table.cell(i, 2).text):<5}'    # cell(i,0)表示第(i+1)行第1列数据,以此类推    print(result)

想

转发到朋友圈是最高的赞赏

python读取txt文件_python读取docx文件，就是如此简单

因为不是天生丽质，所以必须天生励志！

python读取txt文件_python读取docx文件，就是如此简单

01：问题抛出与引入

`一个很简单的docx文件,打印出来的结果却不是我们想要的。对此引入一个十分好用的docx模块,下面就详细介绍该模块的一些基本操作。`

02：安装docx模块

pip install python_docx

03：新建文档对象

`04：添加文档内容`

`05：保存文档内容`

继续阅读

Python编码/文件读取/多线程

python计算文件的行数和读取某一行内容的实现方法

谈判数月、交易额超数十亿美元，苹果曾计划收购英特尔手机调制解调器芯片部门

Python简单操作txt文件

python读取txt文件_Python合并txt文件

python 读取鼠标选中文本_python怎么读取文本文件

python 文件读取指针复位_小白入门篇（一）：Python基础之文件读取的讲解，记得收藏最后：

python读取文件时的相对路径

python读取txt文件_python 爬虫第一课：文件读取

windows用python读取文件open（）函数

python批量读取txt文件并使用mysql批量插入

python读取txt文件_python读取txt读不全问题与乱码问题小结

csv文件怎么转成excel_python怎么读取excel文件

python读取文件_基于Python的Excel文件读取与地震分布图绘制（附源代码）