最佳实战如何把一个模糊PDF文件变得清晰
老白之前下载了很多书籍的PDF电子版本,但是部分感觉不太清晰,想借助一些工具改善下,故去网上找了工具,简单做个日志记录。PDF文件清晰的方法主要有两种:第一种是基于PDF文件本身去实现,对pdf进行优化,提高pdf清晰度,使文字更加清晰,观感更佳。这一类的软件主要有:ImprovePdf、Smallpdf、Adobe Acrobat Online、PDF24 Tools等。第二种方法是先将PDF导出为图片,然后对图片进行清晰化处理,最后将处理后的图片转为PDF。图片清晰化处理的软件就更多了,我这里使用的是边界AICHAT。
1.PDF工具下载
1.1 PDF文件质量改善工具
1.1.1 介绍
ImprovePdf使用python脚本对pdf进行优化,提高pdf清晰度,使文字更加清晰,观感更佳。仅适用黑白扫描版pdf,且文字较清晰,若模糊会更加模糊。
原理说明
- pdf转成png图片
- 再使用opencv对图片局部阈值二值化处理
- 并去除孤立噪点,优化图片观感
- 最后转回pdf并合并,最终达到优化提高pdf清晰度的目的
- (可选)使用potrace处理png转成svg矢量图,使文字线条平滑,观感大幅度提高,接近ocr pdf 。
1.1.2 开源地址
https://github.com/JustDoIt166/improve--pdf
1.1.3 下载链接
https://www.123865.com/s/YHciVv-GGkWd?提取码:33vg
1.2 图片处理工具
1.2.1 介绍
边界AICHAT是一款通过 AI 算法提高图像分辨率(超级分辨率,简称超分)的桌面工具, 它免费、无需联网、开箱即用,因为内置了模型,所以安装包大 200+MB, 运行要求兼容 Vulkan 的显卡,适用于 Windows、Linux 和 macOS 系统。
1.2.2 下载链接
https://www.123865.com/s/YHciVv-PGkWd?提取码:yAHr
2.处理过程
2.1 PDF文件直接处理
这个没什么好处理的,打开软件,选择PDF即可
处理前后PDF文件大小变化不大
2.2 图片处理转PDF
2.2.1 图片处理
如下,打开边界AICHAT软件,选择批量处理
处理结果为(单位:MB):
优化前 优化后
-------------------------
0.05 0.73
0.07 1.37
0.16 6.18
0.04 0.40
0.59 10.65
0.25 7.75
0.24 7.54
0.30 9.12
0.22 6.58
0.59 10.82
0.27 9.04
可见,经过处理后图片大小有非常明显的变化
2.2.2 图片转PDF
此处用acrobat,勾选质量最高的一种转换方式
3.处理结果
如下,结果很明显,一个45M,一个6M。质量我就不放出来了,放出来没啥意义
4.总结
如果你想要更好的效果,建议把PDF转为图片,然后用图片处理工具优化图片,最后把图片再转回PDF。
更多PDF工具见: