标签:
杂谈 |
分类: 菜鸟日记 |
想必大家都有过这种经历,从网页上或者txt文档上复制一段文字到Word中,本该是一段完整的文字,却被人工回车分成了一行行的(如下图),编辑起来非常不方便,一个个的删除又太麻烦,太浪费时间,这个时候不妨试试Word的通配符替换功能。
http://s11/middle/6823cc5d4c8bbf738785a&690
方法:
1、去除所有段落格式(段落:左右缩进0;特殊格式:无;制表符:全部清除);
2、按下“Ctrl+H”组合键,打开“查找和替换”对话框;
3、勾选“使用通配符”,在查找中输入([!。?!:;……——”)])^13{1,},在替换中输入\1;
4、单击“全部替换”。
http://s7/middle/6823cc5d4c8bbf728c466&690
说明:
因为根据汉语标点符号的用法规则,句末标点允许以下几种:句号、问号、感叹句、冒号、分号、中文(全角)省略号、破折号、右引号和右括号。上述代码表示查找所有以非法标点为结尾、硬回车符号为标志的段落,找到后将其硬回车符号(段落标记)标志删除。其中:
()
[]
[!]
[!。?!:;……——”)] 表示以非法中文标点结尾的段落。
^13
{n,}
\1
几点注意:
① 上述方法只针对汉字标点符号,还不包括英文标点的点号、问号和感叹号,如有必要可添加进去,注意与通配符区别开来:对于已被定义为通配符的字符(如?),须在前面加上反斜杠\ 。
② 作为标题、题注的段落,或者某些列表式的段落,其结尾一般不用标点符号。对此应作特殊处理。一般是先处理这些特殊段落,可以对这些特殊段落设定不同样式,以便在删除回车符时将其排除在外(如上图中只查找“正文”样式)。
③ 这个替换代码也不能说是很完美,因为很多不是标点符号的字符也会被替换掉,比如制表位、★、半角空格、全角空格、分节符、分页符(^m)、分栏符等。
更多内容,请参考: