登录注册写文章

解决使用pdfbox转图片中文乱码问题

不要熬夜啦

解决使用pdfbox转图片中文乱码问题

问题背景

K8S上使用pdfbox将pdf转png，出现中文汉字乱码

pdf文件

转换乱码的文件

原因分析

通过查看日志发现异常信息为

Using fallback LiberationSans-Regular for CID-keyed font AdobeKaitiStd-Regular

去匹配字体时没有匹配上，使用了默认的字体，但是默认的字体不支持中文，导致乱码

解决方案

1.在服务运行环境上安装相对应的字体

对外界依赖过高，需要外部人员配合，不方便未采用

2.重写pdfbox代码，对字体匹配处理实现采用

重写org.apache.pdfbox.pdmodel.font.FontMapperImpl

排查下来，服务器中不支持的字体太多，安装字体并不会解决所有适配字体问题

经过源码的分析：源码做了适配最终兜底字体策略，只需要调整支持中文的最终兜底字体即可！

将支持的字体放在项目的resource下，替换实现加载兜底的字体。

解决后转化的图片

最后编辑于：2021.03.20 11:51:04

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

使用pdfbox，将PDF转图片后，中文乱码问题
问题现象：使用pdfbox,将PDF转成图片后，其中的中文显示乱码（方块□□□□□）控制台日志如下：分析：解...
糖醋鲤魚王阅读 10,498评论 0赞 4
wsl(ubuntu)上使用 gitbook 生成 pdf 电子书:解决中文乱码问题
gitbook上有很多电子书, 有些没有提供下载 pdf 功能, 在网上搜了下, 可以使用 gitbook 命令...
mbinary阅读 1,688评论 0赞 0
解决google colab环境下使用matplotlib绘图中文乱码问题
最近通过google colab学习python数据分析的过程中遇到了一个matplotlib绘图中文乱码的问题，...
会飞的月半阅读 7,549评论 0赞 3
MATLAB使用自定义Consolas+Yahei字体解决中文乱码问题【2018-04-29】
环境：Windows10 64bit；MATLAB R2015b 注：MATLAB中找不到系统新安装的字体，参考h...
UnilinU阅读 16,450评论 0赞 7
Activiti 流程图片显示乱码问题分析与解决
Activiti新手常见的问题是，部署成功流程后，获取显示的流程图片（PNG）为乱码，主要体现为中文无法正确显示。...
TKJohn阅读 25,188评论 2赞 12

3赞4赞

赞赏

手机看全文