语音合成效果优化

语音合成技术已经成熟的应用于各种实际场景中,大部分问题可以通过TTS解决,但是有些问题,在具体的场景中,总会出现一些合成音频播报时的错误,所以在设计语音合成产品时,应该怎么样避免这些问题,以及用怎样的方式进行优化。以下将根据实际问题分析具体的解决方案。


1. 数字播报问题

我们遇到比较多的是数字播报的问题,数字有很多不同的播报方式,可以按照数目读法,例如,1234可以读作“一千二百三十四”,也可以按照数字串的读法,读作“一二三四”,以及电报读法“幺两三四”,所以不同的场景有不同的读法,需要在当前场景设置具体的读法方式,具体方式如下:

1)   读法规则设置

在TTS中,有些读法是可以添加的读法规则中的,例如:“请问您是尾号为4321的机主吗?”可以添加“尾号为+数字”的读法规则,让数字按照数字串的方式播报。还有“数字+元”“数字+美元”等,这种就按照数目读法的方式播报。所以在生活场景有一些场景的读法是唯一的,可以通过设置读法规则的方式,使得在TTS播报的时候播报正确。

2)   修改文本的方式

在一些场景中,会出现TTS播报错误的情况,例如,“请您来一下205会议室”,有时候会播报成“二百零五会议室”,这时候可以在文本的数字前面加一个标点来规定读法,比如 “!+数字”,就按照数字串的方式播报数字。“请您来一下!205会议室”,则可以播报为“二零五会议室”;“*+数字”的规则就按照数目读法来播报,“我住在*20层”,则播报为“二十层”。所以根据符号+数字的方式来确保数字的读法,在实际应用场景中,如果某些数字播报方式错误,则可以通过修改文本添加符号的方式解决问题,这种方式也相对比较简单。

3)  标记语言的方式

语音合成标记语言(SSML:Speech Synthesis Markup Language),它是W3C的语音接口框架的一部分,是关于语音应用和在万维网上构建语音应用的一套规范,通过SSML,人们可以更多的通过移动电话、桌面计算机和其他设备来聆听合成语音。通过标记语言可以设置数字的读法,然后将xml格式的标记语言文本传入给TTS,合成相应的音频。

下面是ssml的语法图


4)  加词表

有些使用场景修改文本内容不太方便,例如用户写的地址信息,然后直接传输给TTS进行语音合成,这种文本内容不能进行添加修改,需要在文本上传之后修改播报的音频,在前一篇文章讲到过语言分析部分,在文本转音素时,可以检测出对应的文本内容,文本的音频强制转换为需要正确播报的拼音,设置成想要合成的播报音,这样可以使音频播报正确且不需要修改文本。但是这样在每次合成的时候都会按照这种设置好的规则合成,所以在设置的时候尽量确保文本的唯一性,可以用“文本+数字+文本”的形式,这样其他场景用到同样的数字时,不会受到此次设置的影响。


如下列出了在实际应该场景中,数字会出现的一些播报方式。


数目读法

数字串读法

地址

2. 多音字问题

在汉语中,多音字和数字的读法一样,有多种播报读法,这时候也需要一些优化的方式设置,使其在特定的场景下按照特定的读音去读,确保能正确的播报。优化的方式和数字的优化方式基本是一致的,可以通过设置读法规则,修改文本,标记语言,加词表的方式。通过组合这几种方式,可以避免常见的播报读法的问题。在产品设计的时候,需要支持这几种优化方式,且操作简单,用户可以自行操作,完成TTS的优化。

如下列出多音字姓氏列表,姓氏可以用特定的规则或者用添加标点的形式,确保其正确的播报。

3. 小结

    简单介绍了一些播报错误的优化方式,还有一些韵律也可以用上面提到的优化方式进行优化,例如停顿,重读等一些节奏韵律的变化,可以用加标点的方式,标记语言的方式实现。也可以通过算法优化,但是算法优化时间久,难度大。所以可以在产品设计的时候加一些可以优化的功能,这样可以规避掉一些播报错误,也不需要从底层算法在进行优化,用户易操作,提高用户体验。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容