最佳实战如何把一个模糊PDF文件变得清晰

老白之前下载了很多书籍的PDF电子版本,但是部分感觉不太清晰,想借助一些工具改善下,故去网上找了工具,简单做个日志记录。PDF文件清晰的方法主要有两种:第一种是基于PDF文件本身去实现,对pdf进行优化,提高pdf清晰度,使文字更加清晰,观感更佳。这一类的软件主要有:ImprovePdf、Smallpdf、Adobe Acrobat Online、PDF24 Tools等。第二种方法是先将PDF导出为图片,然后对图片进行清晰化处理,最后将处理后的图片转为PDF。图片清晰化处理的软件就更多了,我这里使用的是边界AICHAT。

最佳实战如何把一个模糊PDF文件变得清晰

1.PDF工具下载

1.1 PDF文件质量改善工具

1.1.1 介绍

ImprovePdf使用python脚本对pdf进行优化,提高pdf清晰度,使文字更加清晰,观感更佳。仅适用黑白扫描版pdf,且文字较清晰,若模糊会更加模糊。

原理说明

  • pdf转成png图片
  • 再使用opencv对图片局部阈值二值化处理
  • 并去除孤立噪点,优化图片观感
  • 最后转回pdf并合并,最终达到优化提高pdf清晰度的目的
  • (可选)使用potrace处理png转成svg矢量图,使文字线条平滑,观感大幅度提高,接近ocr pdf 。

1.1.2 开源地址

https://github.com/JustDoIt166/improve--pdf

1.1.3 下载链接

https://www.123865.com/s/YHciVv-GGkWd?提取码:33vg

1.2 图片处理工具

1.2.1 介绍

边界AICHAT是一款通过 AI 算法提高图像分辨率(超级分辨率,简称超分)的桌面工具, 它免费、无需联网、开箱即用,因为内置了模型,所以安装包大 200+MB, 运行要求兼容 Vulkan 的显卡,适用于 Windows、Linux 和 macOS 系统。

1.2.2 下载链接

https://www.123865.com/s/YHciVv-PGkWd?提取码:yAHr

2.处理过程

2.1 PDF文件直接处理

这个没什么好处理的,打开软件,选择PDF即可

处理前后PDF文件大小变化不大

最佳实战如何把一个模糊PDF文件变得清晰

2.2 图片处理转PDF

2.2.1 图片处理

如下,打开边界AICHAT软件,选择批量处理

最佳实战如何把一个模糊PDF文件变得清晰

处理结果为(单位:MB):

优化前        优化后
-------------------------
0.05         0.73
0.07         1.37
0.16         6.18
0.04         0.40
0.59         10.65
0.25         7.75
0.24         7.54
0.30         9.12
0.22         6.58
0.59         10.82
0.27         9.04

可见,经过处理后图片大小有非常明显的变化

2.2.2 图片转PDF

此处用acrobat,勾选质量最高的一种转换方式

最佳实战如何把一个模糊PDF文件变得清晰

3.处理结果

如下,结果很明显,一个45M,一个6M。质量我就不放出来了,放出来没啥意义

最佳实战如何把一个模糊PDF文件变得清晰

4.总结

如果你想要更好的效果,建议把PDF转为图片,然后用图片处理工具优化图片,最后把图片再转回PDF。

更多PDF工具见:

吾爱PDF文件水印批量去除工具

XDF转PDF软件:稻壳阅读器便携免安装单文件版

安卓手机免费拍照转PDF软件-PDF转换器

电脑PDF合并工具单文件版PDFBinder-v1.2支持排序

PDF文件被保护/需要输入许可口令密码

分享一个Word批量转PDF的bat脚本