2019-07-11 ActionScript3.0使用百度智能API OCR识别图片中文字

昨天开始使用百度的API来整合到图片提取工具中，
百度OCR通用版本的识别免费次数有50000次/天，应该满足需求。

因为没有现有的AS3代码实现，所以参考网上JAVA代码实现
API地址：
https://cloud.baidu.com/doc/OCR/OCR-API/24.5C.E8.BF.94.E5.9B.9E.E8.AF.B4.E6.98.8E.html
https://cloud.baidu.com/doc/OCR/s/zjwvxzrw8/

先用百度帐号登录百度智能，点击“管理控制台”进到后台管理页。
选择产品 ===>文字识别
创建一个应用，就可以获得appid/appKey/serectKey.调用的时候需要用这三个值去获得token

调用的逻辑
1，程序打开的时候，先获取access_token.

/**百度文字识别（高精度版）的路径**/
public static var ocr_url_1:String = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic";     
/**百度文字识别（通用版）的路径**/
public static var ocr_url_2:String = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic";      
/**百度签权URL，获取TOKEN**/
public static var ocr_token_url:String = "https://aip.baidubce.com/oauth/2.0/token";

public function startCheckApp():void
        {
            var req:URLRequest = new URLRequest();
            req.url = OCRBaiduDefault.ocr_token_url;
            req.method = URLRequestMethod.POST;
            var val:String = "grant_type=client_credentials&client_id={1}&client_secret={2}";//参数说明自行查看官方文档
            val = val.replace("{1}",OCRBaiduDefault.ocr_apiKey).replace("{2}",OCRBaiduDefault.ocr_screctKey);
            req.data = new URLVariables(val);
            
            var loader:URLLoader = new URLLoader();
            loader.addEventListener(Event.COMPLETE,onRequsetToken);
            loader.load(req);       
        }
        
        
        private function onRequsetToken(e:Event):void
        {
            var str:String = e.target.data;
            var res:Object = JSON.parse(str);
            if(res.hasOwnProperty("error_code"))
            {
                trace("报错："+str);
            }
            else
            {
                var token:String = res.access_token;
                var time:* = res.expires_in;
                OCRBaiduDefault.ocr_access_token = token;//获取到的token值保存在静态变量里
            }
        }

2，把本地的图片加载，获得二进制数组.这一段是基础的加载ByteArray

private function onClick(e:*):void
{
    var url:String = "G:/Aproj6Haiwai/taiwan_ws/client/proj/bin/h5/res/art/artifact2/lz_lingzhen_hose_01.png";
    var loader:URLLoader = new URLLoader();
    loader.dataFormat = URLLoaderDataFormat.BINARY;
    loader.addEventListener(Event.COMPLETE,onLoaded);
    loader.load(new URLRequest(url));
}
private function onLoaded(e:Event):void
{
    var bytes:ByteArray = e.target.data;
    OCRReqManager.getIns().startOCRrequest(bytes);
}

3，把二进制数组进行编码Base64,再用encodeURI编码
4，把token当成url参数，请求头Content_Type 设置为application/x-www-form-urlencoded。

public function startOCRrequest(bytes:ByteArray):void
        {
            var req:URLRequest = new URLRequest();
                        var base64:String = Base64.encodeByteArray(bytes);  
            baseStr = baseStr.replace("\n","");
            var variables:URLVariables = new URLVariables();
            variables.image = baseStr;
            req.data = variables;
            //开始用这种写法，
            //一直报216201 image format error.也不知道为啥
            //base64 = encodeURI(base64);
            //var val:String = "image={1}";
            //val = val.replace("{1}",base64);
            //req.data = new URLVariables(val);                 
            
            //https://aip.baidubce.com/rest/2.0/ocr/v1/general?access_token="前面获取的token值"
            req.url = OCRBaiduDefault.ocr_url_2 + "?access_token="+OCRBaiduDefault.ocr_access_token;
            req.method = URLRequestMethod.POST;         
            var header:URLRequestHeader = new URLRequestHeader("Content-Type","application/x-www-form-urlencoded");
            req.requestHeaders.push(header);
            
            var loader:URLLoader = new URLLoader();
            loader.addEventListener(Event.COMPLETE,onRequestBack);
            loader.load(req);       
        }
        
        private function onRequestBack(e:Event):void
        {
            var str:String = e.target.data;
            var res:Object = JSON.parse(str);
            if(res.hasOwnProperty("error_code"))
            {
                trace("报错："+str);
            }
            else
            {
                var backVo:OCRBaiduVo = OCRBaiduVo.encodeJSON(str);
            }
        }

返回值

{"log_id": 7247048436949274572, "words_result_num": 3, "words_result": [
  {"words": "角色连击酷炫外观"}, {"words": "等你来寻宝!"}, {"words": "小手一抖,葫芦到手"}
]}

这里踩了个坑，就是开始用variables.encode(str)这种方法，把base64码传进的时候，报错，虽然网页的Network记录看起来发送是一样的。这里卡住我挺久的。

知识点

1.一般网络请求，提交图片文件都用Base64格式，通过post的参数

另外

尝试了google tesseract OCR 工具
安装和环境变量配置：
https://blog.csdn.net/qq_40147863/article/details/82285920
教程上说自己下载语言包，实际在安装时选中要安装的语言包就可以了
下载了最新版本5.0.0，项目中的图片因为不是正楷字，辨识太差了，所以不考虑。
如果今后用到辨识端正的字体或数字，应该还是可以用的

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,386评论 6赞 506
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,142评论 3赞 394
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,704评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,702评论 1赞 294
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,716评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,573评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,314评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,230评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,680评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,873评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,991评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,706评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,329评论 3赞 330
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,910评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,038评论 1赞 270
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,158评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,941评论 2赞 355

2019-07-11 ActionScript3.0使用百度智能API OCR识别图片中文字

知识点

另外

推荐阅读更多精彩内容