开源项目:https://github.com/senlinuc/caffe_ocr.
caffe_ocr是一个对现有主流ocr算法研究实验性的项目,目前实现了CNN+BLSTM+CTC的识别架构,并在数据准备、网络设计、调参等方面进行了诸多的实验。代码包含了对lstm、warp-ctc、multi-label等的适配和修改,还有基于inception、restnet、densenet的网络结构。代码是针对windows平台的,linux平台下只需要合并相关的修改到caffe代码中即可。
本文主要针对windows平台给出项目配置和编译方法.
安装依赖项和编译器
opencv2.4.10
boost1.57.0
cuda8.0
cudnn
编译器:vs2015
编译器和依赖库与其他版本的兼容性不好,必须安装对应的版本,后面才能编译成功.
注意,在编译boost库时,如果直接运行b2.exe生成的是32位版本,需要在命令行中加参数:address-model=64.详细信息可以查看:http://blog.csdn.net/wangxvfeng101/article/details/47002853
编译
打开caffe-vsproj文件夹下的caffe.sln文件
在vs2015中配置相应的dll, lib, chh等依赖项,详细可见github教程中的readme信息.
最后右击"项目名称"->生成.编译成功.