App Inventor 语音交互技术

本文由 WxBit 站长原创,转载请注明出处。内容仅适用于 App Inventor 2 WxBit 汉化版

WxBit 汉化版在周末悄悄发布一个里程碑更新,增加了“人工智能”分类,其中的百度语音识别、合成与唤醒,给 App Inventor 应用增加了嘴巴和耳朵。有别于“多媒体”分类中的语音合成与识别组件,百度语音交互组件不要求手机安装第三方语音识别应用与合成引擎,通用性更好。本站独有的语音交互组件,让我们轻松实现属于自己的语音助理。

人工智能组件

  在开始介绍语音交互组件前,先要介绍自定义“应用包名(Package Name)”,在应用首屏(Screen1)的设计视图属性中设置。这个功能虽然已经上线有一段时间,但是应该很多同学没有注意,也没有用过。应用包名,在 App Inventor 中等同于应用ID,是应用的唯一标识,类似人的身份证号码。包名中只能包含数字、字母、点和下划线,点为分隔符,将包名分割为多个部分,每部分必须以字母开头。例如:com.wxbit.appinventor.aicompanion3,这是 ai伴侣的包名。_com.abc、com.123、.com.abc,这些都是错误格式的包名。

设置应用包名

如果不设置包名,系统生成APK的包名一般是这样:wxbit.ai_Q(32位唯一标识).项目名称,例如:wxbit.ai_QCCC18AB0D04C3B7CFD21E1D67A60AF0F.test。如果设置应用包名,系统默认会在前面加上“wxbit.”前缀。比如填写appinventor,则最后生成APK的包名就是:wxbit.appinventor。

如果需要使用离线合成和语音唤醒,正确设置应用包名是必须的步骤。

下面分别介绍百度语音交互3大组件:

一、百度语音识别

使用流式协议,能够听用户说,即时处理获得结果。不需要像Rest API,上传整个录音文件才获得结果。即时响应,能够给用户更好的使用体验。

百度语音识别功能概要

  识别模式提供了多种配置,适用于不同的场景。

语音识别的场景模式

详细说明请参考文档:http://ai.baidu.com/docs#/ASR-Android-SDK/3557153c

二、百度语音合成

不同于Rest API下载完整个音频文件再播放,在线模式能够一边下载一边播放。百度语音合成不支持“纯离线”模式,首先都会尝试联网,如果选择的不是“纯在线模式”,联网超时后会使用内置的离线引擎合成语音。需要注意的是,第一次使用离线语音合成,一定需要联网下载授权文件。授权文件与 AppId、AppKey、SecretKey 和应用包名相关,详细配置本文最后再说明。

语音合成功能概要

  纯在线模式:也就是不使用离线引擎,生成的APK文件较小,推荐使用。

WiFi在线,6秒超时:连接 WiFi 时使用在线合成,如果 6 秒还未连接成功和连接的不是 WiFi 网络,则使用离线合成。

WiFi与4G在线,6秒超时:连接 WiFi 和 4G 网络时使用在线合成,如果 6 秒还未连接成功或使用的是其他网络,则使用离线合成。

WiFi与4G在线,1.2秒超时:同上,连接超时时间为1.2秒。

WiFi在线,1.2秒超时:同“WiFi在线,6秒超时”,连接超时时间为1.2秒。

详细说明请参考文档:http://ai.baidu.com/docs#/TTS-Android-SDK/47c81acf

三、百度语音唤醒

此唤醒,并非点亮手机屏幕这个“唤醒”。而是应用听到用户说的特定关键词,会触发事件代码块。启用后台唤醒后,即使手机是锁屏状态,也一样可以触发事件代码块。后台唤醒功能,会加速电量消耗,请谨慎使用。

语音唤醒功能概要

系统内置支持10个关键词,分别是:小宝同学、拍照、播放、暂停、上一首、下一首、增大音量、减小音量、打开电灯、关闭电灯。如果需要自定义唤醒词,请到这里导出:http://ai.baidu.com/tech/speech/wake 。导出的唤醒词为WakeUp.bin,上传这个文件到项目的素材中即可。

在设计视图或逻辑视图中启用语音唤醒功能,当用户说到唤醒词,“被语音唤醒”事件会被触发,在这个代码块中完成对用户的回应。

因为语音唤醒,是离线识别,必须正确配置 AppId、AppKey、SecretKey 和应用包名。如果只是为了测试,可以留空以上三个参数,应用包名设置为:baidu。生成APK的应用包名实际是 wxbit.baidu,使用了本文作者配置的百度语音应用。

本文由 WxBit 站长原创,转载请注明出处。内容仅适用于 App Inventor 2 WxBit 汉化版

下文介绍百度语音应用的创建,如果你已经有百度云服务帐号,直接进入控制台创建应用。

1、注册百度云帐号

打开https://cloud.baidu.com,点击“管理控制台”,进入登录界面。如果没有百度帐号,请先注册一个,具体步骤这里不做赘述。注册完百度帐号,回到这里注册百度云帐号。

百度云注册

  第一次登录百度云需要补充些信息,然后进入控制台。

百度云控制台

2、创建语音交互应用

从控制台进入“语音识别”创建应用,并选择“Android”,然后填写ai项目首屏设置的包名,加上“wxbit.”前缀。比如ai项目应用包名设置的是 com.appinventor.project,在这里应该填写:wxbit.com.appinventor.project 。

在百度云创建语音交互应用

3、获取 AppId、AppKey、SecretKey

查看应用详情

  填写好应用包名与百度语音应用的参数,就可以使用百度语音组件啦。

包名及语音参数设置


这里有个使用百度语音组件实现的演示应用,供大家测试:语音交互功能演示.apk

语音交互功能演示
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,723评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,485评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,998评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,323评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,355评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,079评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,389评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,019评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,519评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,971评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,100评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,738评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,293评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,289评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,517评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,547评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,834评论 2 345

推荐阅读更多精彩内容

  • 语音方案比对介绍 语音交互是现今应用最多的智能交互方式,在人工智能越来越火的当下应用十分广泛,所以特别针对车内环境...
    莫君陌阅读 3,463评论 0 6
  • 1调研背景 2014年11月发布亚马逊低调发布智能音箱Echo,内测半年后于2015年正式发售,当年销量为250万...
    殷大侠阅读 2,441评论 0 8
  • 暑假,在福建的一个小镇上,陪姐姐和外甥度过了一段快乐的时光,现在坐在回去的车上,凭着记忆记录下这些趣事。 也许,这...
    阿银老师阅读 458评论 12 8
  • 11月12日凌晨,我的外婆走了,那个管我叫“阿弟”的人走了。从今以后,当我再叫“外婆”的时候,再也不会有人笑着、大...
    叶落阶前阅读 1,240评论 0 2
  • 风吹秋凉 我站在陌生的城市的窗旁 风就这样吹了进来 我向南方眺望 树在摇摆、沙沙的响 一片、两片、三片、的树叶 被...
    汤唯民阅读 367评论 0 2