主楼是网上搬运教程,回帖楼层目录是自己写的,
目录的正则可用提供的两个网站测试。当然教程附件也提供工具
https://hiregex.com/
https://deerchao.cn/tools/wegester/
目录(按楼层来):
1.浅谈正则表达式在文本处理中的应用
2.去除章节标题间的数字的正则(如第47章47第五个,去掉中间的47)
3.赘余的搜查正则
4.查中文间的-,替换为圆点(替换外国人名,不误伤其他)
5.跨行英文引号的处理
6.章节名跨行合并(比如第一章
心灵术士 改成第一章 心灵术士)
7.章节序号重排 (比如第1章 第3章 第4章这种批量自动改成第1章 第2章 第3章)
8.纯中文标题前面加章节名(比如图书射手6变成第1章 图书射手6)
9.咬文嚼字
10.查找不同序号名但相同章节的标题(比如第一章 唧唧哇哇
第二章 唧唧哇哇)
11.专门删掉章节末尾的独立成段省略号
12.【”,】【”。】统一为【。”】
13.批量去除章节名前的1. 2.(比如1.第1章 )
14.章节名和正文混一行的处理
15.
16.没有第X章而又有重复两行的章节标题
17.
18.
19.
22.
23.
24.
25.
26.
27.两个空白行删一行或者三个空白行删一行
28.复制派派的评分记录
29.删除两个中文中间的点号
30.——所以改成——
所以