PDF按关键字拆分工具支持在浏览器本地提取 PDF 页面文本,根据关键字命中页自动建立分段起点,并导出独立 PDF 或 ZIP 压缩包,适合整理合同、报告、讲义、电子书章节和扫描资料。
核心功能
- 支持上传或拖拽单个 PDF 文件。
- 支持一行一个关键字,也支持逗号、分号分隔。
- 支持任一关键字命中或全部关键字同时命中两种模式。
- 支持忽略空白字符、区分大小写和相邻命中页合并。
- 支持将首个命中页前的页面并入第一段或单独导出。
- 支持预览命中页、锚点关键字和生成分段范围。
- 单段可直接导出 PDF,多段可打包为 ZIP。
使用步骤
- 上传需要拆分的 PDF 文件。
- 在关键字列表中填写章节标题、合同编号、发票抬头或其他定位文本。
- 根据 PDF 内容选择匹配模式和首段处理方式。
- 点击“预览拆分”,确认命中页和分段范围。
- 点击“开始导出”,生成后下载 PDF 或 ZIP 文件。
匹配说明
- “任一关键字命中”适合多个章节标题、订单号或分类词分别作为起点。
- “必须同时命中全部关键字”适合同一页面需要同时包含多个固定词的场景。
- “忽略空白字符”可提升目录、标题和扫描识别文本存在换行时的匹配率。
- “相邻命中页只保留第一个起点”可避免连续多页都出现同一关键字时产生过多短段。
适用场景
- 按章节标题拆分电子书、教材或培训讲义。
- 按合同编号、客户名称或附件标题整理合同资料。
- 按报告栏目、发票清单或业务关键字拆分归档文件。
- 对可提取文本的扫描资料进行本地分段导出。
隐私说明
当前工具在浏览器本地读取、分析和导出 PDF 文件,不会主动上传文件内容到服务器。