Python处理docx,代码如下
# 读取docx中的文本代码示例
import docx
# 获取文档对象
file = docx.Document(r"D:\test_1.docx")
print("段落数:" + str(len(file.paragraphs))) # 段落数为13,每个回车隔离一段
# 输出每一段的内容
for para in file.paragraphs:
print(para.text)
# 输出段落编号及段落内容
for i in range(len(file.paragraphs)):
print("第" + str(i) + "段的内容是:" + file.paragraphs[i].text)
执行结果
但是之前却遇到问题,报错如下:
ModuleNotFoundError: No module named 'exceptions'
已经安装docx模块,经过网上查询,找到解决方法
1)卸载docx模块
pip uninstall docx
2)安装python-docx模块
pip install python-docx
替换模块,代码没有任何更改,问题成功解决,哈哈哈