昨天开始使用百度的API来整合到图片提取工具中,
百度OCR通用版本的识别免费次数有50000次/天,应该满足需求。
因为没有现有的AS3代码实现,所以参考网上JAVA代码实现
API地址:
https://cloud.baidu.com/doc/OCR/OCR-API/24.5C.E8.BF.94.E5.9B.9E.E8.AF.B4.E6.98.8E.html
https://cloud.baidu.com/doc/OCR/s/zjwvxzrw8/
先用百度帐号登录百度智能,点击“管理控制台”进到后台管理页。
选择产品 ===>文字识别
创建一个应用,就可以获得appid/appKey/serectKey.调用的时候需要用这三个值去获得token
调用的逻辑
1,程序打开的时候,先获取access_token.
/**百度文字识别(高精度版)的路径**/
public static var ocr_url_1:String = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic";
/**百度文字识别(通用版)的路径**/
public static var ocr_url_2:String = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic";
/**百度签权URL,获取TOKEN**/
public static var ocr_token_url:String = "https://aip.baidubce.com/oauth/2.0/token";
public function startCheckApp():void
{
var req:URLRequest = new URLRequest();
req.url = OCRBaiduDefault.ocr_token_url;
req.method = URLRequestMethod.POST;
var val:String = "grant_type=client_credentials&client_id={1}&client_secret={2}";//参数说明自行查看官方文档
val = val.replace("{1}",OCRBaiduDefault.ocr_apiKey).replace("{2}",OCRBaiduDefault.ocr_screctKey);
req.data = new URLVariables(val);
var loader:URLLoader = new URLLoader();
loader.addEventListener(Event.COMPLETE,onRequsetToken);
loader.load(req);
}
private function onRequsetToken(e:Event):void
{
var str:String = e.target.data;
var res:Object = JSON.parse(str);
if(res.hasOwnProperty("error_code"))
{
trace("报错:"+str);
}
else
{
var token:String = res.access_token;
var time:* = res.expires_in;
OCRBaiduDefault.ocr_access_token = token;//获取到的token值保存在静态变量里
}
}
2,把本地的图片加载,获得二进制数组.这一段是基础的加载ByteArray
private function onClick(e:*):void
{
var url:String = "G:/Aproj6Haiwai/taiwan_ws/client/proj/bin/h5/res/art/artifact2/lz_lingzhen_hose_01.png";
var loader:URLLoader = new URLLoader();
loader.dataFormat = URLLoaderDataFormat.BINARY;
loader.addEventListener(Event.COMPLETE,onLoaded);
loader.load(new URLRequest(url));
}
private function onLoaded(e:Event):void
{
var bytes:ByteArray = e.target.data;
OCRReqManager.getIns().startOCRrequest(bytes);
}
3,把二进制数组进行编码Base64,再用encodeURI编码
4,把token当成url参数,请求头Content_Type 设置为application/x-www-form-urlencoded。
public function startOCRrequest(bytes:ByteArray):void
{
var req:URLRequest = new URLRequest();
var base64:String = Base64.encodeByteArray(bytes);
baseStr = baseStr.replace("\n","");
var variables:URLVariables = new URLVariables();
variables.image = baseStr;
req.data = variables;
//开始用这种写法,
//一直报216201 image format error.也不知道为啥
//base64 = encodeURI(base64);
//var val:String = "image={1}";
//val = val.replace("{1}",base64);
//req.data = new URLVariables(val);
//https://aip.baidubce.com/rest/2.0/ocr/v1/general?access_token="前面获取的token值"
req.url = OCRBaiduDefault.ocr_url_2 + "?access_token="+OCRBaiduDefault.ocr_access_token;
req.method = URLRequestMethod.POST;
var header:URLRequestHeader = new URLRequestHeader("Content-Type","application/x-www-form-urlencoded");
req.requestHeaders.push(header);
var loader:URLLoader = new URLLoader();
loader.addEventListener(Event.COMPLETE,onRequestBack);
loader.load(req);
}
private function onRequestBack(e:Event):void
{
var str:String = e.target.data;
var res:Object = JSON.parse(str);
if(res.hasOwnProperty("error_code"))
{
trace("报错:"+str);
}
else
{
var backVo:OCRBaiduVo = OCRBaiduVo.encodeJSON(str);
}
}
返回值
{"log_id": 7247048436949274572, "words_result_num": 3, "words_result": [
{"words": "角色连击酷炫外观"}, {"words": "等你来寻宝!"}, {"words": "小手一抖,葫芦到手"}
]}
这里踩了个坑,就是开始用variables.encode(str)这种方法,把base64码传进的时候,报错,虽然网页的Network记录看起来发送是一样的。这里卡住我挺久的。
知识点
1.一般网络请求,提交图片文件都用Base64格式,通过post的参数
另外
尝试了google tesseract OCR 工具
安装和环境变量配置:
https://blog.csdn.net/qq_40147863/article/details/82285920
教程上说自己下载语言包,实际在安装时选中要安装的语言包就可以了
下载了最新版本5.0.0,项目中的图片因为不是正楷字,辨识太差了,所以不考虑。
如果今后用到辨识端正的字体或数字,应该还是可以用的