吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1381|回复: 5
收起左侧

[求助] 小白再求助,如何利用python根据word新目录加入对应的正文并保存?

[复制链接]
woqunina 发表于 2022-1-15 22:51
本帖最后由 woqunina 于 2022-1-16 10:48 编辑

对于小白的我来说,昨天的问题各位大神昨天给出的答案给了很大的启发,再次表示感谢!!!
其他小白也可以学习一下(大神略过),实际例子:


小白求助,如何利用python提取word中部分段落并另存? - 『编程语言区』 - 吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn


想起以前遇到的实际问题,根据实际困难对昨天的问题进一步进行引申,烦请各位大神再费心帮助,在此谢过!




问题是这样的:
一篇完整word里面有很多的章节(假设最多到三级标题),根据新word文件的目录提纲,提取原word对应章节的正文加入到新的word中(例子见下图)。


QQqqqqqqqq20220115214349.png
满足以下条件(文字的大小,空两格,是否居中......等样式暂不考虑):
1.新老word二级或三级标题名称一致,标题之下的内容完全一致(包括原word中包含的图片和表格),但是新word的标题顺序和级别发生了变化.
2.假设原word有很多个段落,很难采用查段落个数(例如P1 = doc.paragraphs[1])方式定义,想通过目录提纲内容里面的“关键字”来解决问题(因为标题名称是一致的,且唯一),即根据二三级标题顺序加入对应的正文(具体还是见上图)。

我可以按照关键字找到标题行,但是标题行之下的正文怎么加进去就不会了
[Python] 纯文本查看 复制代码
#encoding:utf-8
from docx import Document
doc = Document('g:/python/0.docx')
content="\n".join([para.text for para in doc.paragraphs])
a=content.split("\n")
b=[]
for i in a:
    if "自然的定义" in i:
        b.append(i)
doc1 = Document('g:/python/01.docx')
for i in b:
    doc1.add_paragraph(i)
doc1.save('g:/python/03.docx')




我测试用的word
https://time2hour.lanzouo.com/iAVvbyu47id


真心想学习python办公自动化,想用python-docx解决实际问题。

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

lc01t1watz9 发表于 2022-1-16 11:24
共同学习,大家辛苦了
 楼主| woqunina 发表于 2022-1-16 11:45
hello_pj 发表于 2022-1-16 13:48
想完美还是比较难,图表的标题及相应的引用都要随之改变。
 楼主| woqunina 发表于 2022-1-16 15:21
hello_pj 发表于 2022-1-16 13:48
想完美还是比较难,图表的标题及相应的引用都要随之改变。

图标的标题,可以先忽略,先解决核心问题,如果帮忙感激不尽
 楼主| woqunina 发表于 2022-1-21 12:05
有没有大神,指导一下,谢谢
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止回复与主题无关非技术内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-7 00:51

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表