乔山办公网我们一直在努力
您的位置:乔山办公网 > office365 > 如何快速找出 同一个Word文件中的重复内容

如何快速找出 同一个Word文件中的重复内容

作者:乔山办公网日期:

返回目录:office365


将每一个题目先用替换功能将其变为一个段落(题目开头的序号要符合一定的规律,就是将题目自身的回车符替换成一个特殊字符串,方便处理好后再替换回来),然后用替换将题目序号和题目之间插入制表符(tab键),然后将所有内容复制黏贴到excel表格里,用excel的自动排序功能,进行排序,然后用excel的相等判断功能判断重复内容,然后将重复的内容整行删除,将处理好的表格,复制黏贴到word中,仅保留文字,然后再用替换将制表符替换掉,并将第一次替换的特殊字符串替换回回车
  另外如果文档中有图片,那么就只能进行到excel的重复判断部分,然后根据excel的判断结果,在word中搜索相应的重复内容,直接在word中进行删除。

word 中有一个叫做通配符的功能很强大 ,如果只是简单的查找重复内容的话 ctrl+F 完全可以满足了 如果需要查找重复的段落的话 简单的查找肯定不行
如果是连续的重复段落:
点击:编辑-替换
勾选通配符
查找内容:(^13)([!^13]@^13){2,}
替换为:\1\2
全部替换
重复一下,看看有没有替换干净(一个段落一般不会重复255次以上吧,呵呵),不行就再来几次,直到
替换处数为0。
此命令效率非常之高!成千上万页内容可瞬间完成!

如果是不连续的重复段落:
点击:编辑-替换
勾选通配符
查找内容:(^13[!^13]@^13)(*)\1
替换为:^13\1\2
全部替换
重复几次,只到替换处数为0。
此命令对数百页文档可能需时较长,因为要执行循环比较,请耐心等候!
Enjoy!

[查找内容:(^13[!^13]@^13){2,}
替换为:\1
这段代码的意思:
^13表示段落标记,[!]表示“非”,[!^13]表示段落标记之外的任意单个字符;@表示一个以上的前一字符或表达式,它跟[!^13]一起表示一个以上的段落标记之外的字符,^13[!^13]@^13也就是包含前后段落标记的、有任意个字符的、非空的段落;用圆括号将其括起来(^13[!^13]@^13),意思是将这一部分加以标识,这是我们标识的第一部分,下面替换为框中的\1代表的就是它!
{n,}代表至少 n
个前一字符或表达式,那么{2,}当然就表示2个以上这样的段落(括号括起来的部分),注意,应该是完全相同的段落!注意这里的{2,}不可以用@来替代,如果用@的话,因为它也包括“一个”的情况,那么在执行的时候,所有的不重复的段落也会被它自己替换一遍,执行效率要大打折扣!
题外话:正则表达式里要是有一个代码表示“两个或两个以上”的意思,该多好啊!
另外,这段代码里,[!^13]这个思e799bee5baa6e79fa5e98193e58685e5aeb9365想我自己觉得用的比较好!电脑也好判断啊,呵呵!]
给你个思路,将每一个题目先用替换功能将其变为一个段落(题目开头的序号要符合一定的规律,就是将题目自身的回车符替换成一个特殊字符串,方便处理好后再替换回来),然后用替换将题目序号和题目之间插入制表符(tab键),然后将所有内容复制黏贴到excel表格里,用excel的自动排序功能,进行排序,然后用excel的相等判断功能判断重复内容,然后将重复的内容整行删除,将处理好的表格,复制黏贴到word中,仅保留文字,然后再用替换将制表符替换掉,并将第一次替换的特殊字符串替换回回车。
另外如果你的文档中有图片,那么你就只能进行到excel的重复判断部分,然后根据excel的判断结果,在word中搜索相应的重复内容,直接在word中进行删除。

Excel小技巧

相关阅读

  • 如何快速找出 同一个Word文件中的重复内容

  • 乔山办公网office365
  • 将每一个题目先用替换功能将其变为一个段落来(题目开头的序号要符合一定的规律,就是将题目自身的回车符替换成一个特殊字符串,方便处理好后再替换回来),然后用替换将题目
关键词不能为空
极力推荐

ppt怎么做_excel表格制作_office365_word文档_365办公网