说明文档

PDF页面去重工具用于识别同一 PDF 内重复出现的页面,并在浏览器本地生成保留首次页面的新 PDF。文件不会上传服务器,适合处理扫描件、合同归档、课件合并、发票凭证整理等重复页清理场景。

功能特点

  • 支持精确匹配:用于删除渲染结果完全一致的重复页面。
  • 支持近似匹配:在精确匹配基础上比较页面视觉特征,适合清理轻微差异的扫描重复页。
  • 支持渲染精度设置:可在处理速度和识别稳定性之间切换。
  • 输出重复页映射:显示被删除页面对应保留的首次页面。

使用建议

先使用精确匹配处理正式文件,确认无误后再尝试近似匹配。近似阈值越高,越容易把相似页面判定为重复页面;处理合同、票据、证书等重要文件时,建议使用较低阈值并检查结果页数。

隐私与限制

PDF 读取、页面渲染、去重和导出都在本地浏览器中完成。加密 PDF、损坏 PDF 或浏览器无法渲染的特殊文件可能无法直接处理。