随着港澳与内地的交流增多,在文化上的交流也变得日益频繁。我们在进行资料收集、分享的过程中,可能会接触到一些港澳文件,而这些文件大多是以繁体字的形式撰写。
如果我们将这些包含繁体字的文件导入到ABBYY FineReader PDF 15文字识别软件中,可能会出现识别错误,那么,我们该如何调整软件,让其顺利识别繁体字?
一、繁体字的识别错误
由于ABBYY FineReader PDF 15默认使用的识别语言是简体中文与英语,因此,如果页面中出现繁体字的话,如图1所示,就会出现将繁体字识别为乱码的状况。
二、修正识别错误
鉴于以上原因,如果要修正繁体字的识别错误,就要将繁体中文添加到软件的识别语言中,具体的操作如下:
1、打开语言编辑器
首先,我们需要打开语言编辑器,将繁体中文添加到编辑器中。
打开语言编辑器的方法有两种,第一种如图2所示,ABBYY FineReader PDF 15完成页面识别后,出现改进识别结果的提示,一般情况下,如果文本出现了无法识别的语言,如繁体字,就会出现“打开编辑器”的链接。
如果您已经将提示窗口关闭的话,如图3所示,也可以在软件的顶部快捷菜单中,打开语言的下拉菜单,选择“更多语言”选项。
这里需要注意的是,我们可以直接将识别语言切换为繁体中文和英语,但如果需要同时包含简体中文与繁体中文的话,就要打开“更多语言”选项。
2、勾选繁体中文
打开语言编辑器后,如图4所示,勾选“简体中文和英语”以及“繁体中文”,即可将两种语言添加到当前识别语言中。
3、重新识别所有页面
完成识别语言的调整后,回到ABBYY FineReader PDF 15的主界面,并单击其顶部快捷菜单中的“识别”按钮,即可重新识别所有页面。
如图6所示,可以看到,重新识别页面后,页面中包含的繁体字就被正确识别出来了。
三、小结
综上所述,ABBYY FineReader PDF 15不仅提供了常用的简体中文与英文的文字OCR识别功能,而且还内置了繁体中文的识别语言,可供我们随时添加使用。