Microsoft Office Document Imaging(Office2007)组件实现(下载Interop.MODI.dll)。暂依赖开发环境和运行环境
如果利用微软自带的组件Microsoft Office Document Imaging(2003年公布)(Office 2007)直接运行:
默认安装office的时候不会安装,需用office安装盘安装这个组件
2003/2007安装组件参考:https://jingyan.baidu.com/article/359911f57f931257fe0306e7.html
2010安装组件参考:https://blog.csdn.net/wangchaoqi1985/article/details/80651055
win7物理机上运行,偶尔会出现错误OCR running error,同时该组件的兼容性不是很好, 使用win7 Office2007的时需要打office2007补丁sp1或sp2才能读取中文
示例:
MODI.Document doc = new MODI.Document();
doc.Create(img_Path);
MODI.Image image;
MODI.Layout layout;
doc.OCR(MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED, true, true); // 识别简体中文
for (int i = 0; i < doc.Images.Count; i++)
{
image = (MODI.Image)doc.Images[i];
layout = image.Layout;
sb.Append(layout.Text);
}
MessageBox.Show(sb.ToString());