【技术组工具分享】综合教程-视频语音转文字(2019.6.21更新)

2019.6.21更新

转自虫部落赵云007提供的免费音频转文字软件:

软件基于百度语音识别,正确率和速度都不错

目前只有音频转文字的功能,仅支持普通话,支持批量选取音频转换,不限时长,免费,如下图测试批量音频识别正确率:

(1)比如批量识别小学生课文


(2)比如识别长达五分钟的《荷塘月色》


(3)识别岳云鹏的相声


3、软件操作

打开可能慢,且软件开启后带着cmd黑框。


4、软件下载

链接:https://pan.baidu.com/s/1knYlZfj4PayPdHqc3LaMEA

提取码:oslt


大家在浏览、工作的时候可能经常碰到以下问题,使得我们非常恼火:

1.网页限制视频下载

2.视频、音频的格式乱七八糟,需要转换的时候很不方便

3.没有靠谱的语音识别/机器翻译软件

4.讲座又没有字幕,需要记录发言人讲的话非常麻烦

不过不用担心,本次技术组针对第四点,将问题本身和衍生出来的子问题一网打尽,为各位提供便利的方法。



视频语音如何转成文字?

Step1:下载视频

这里技术组提供了一个好用的视频链接解析网站——视频鱼,只要输入链接,就可以在站内进行下载(也可以用来针对国内一些无良的视频门户网站)

网址:

http://shipinyu.com/


视频鱼使用图(1)

也可以自由选择下载的大小与格式。

视频鱼使用图(2)

Step2:转换成音频

格式的转换和合并等操作,就需要一门神器——格式工厂的帮助了。

下载:

http://www.pcfreetime.com/

格式工厂适用文件

如果视频网站把视频分成了很多片段,可以下载后用之前分享的Bulk Rename Utility进行编号,然后使用格式工厂将这些片段的视频进行合并。


格式工厂视频合并图

再利用格式工厂将视频格式转换成需要音频格式。

格式工厂转换图

Step3:语音识别+机器翻译

一切准备工作就绪,在最后的是最困难的工作。

机翻其实目前已有很多成熟的工具,但由于目前的语音识别技术相比较机器翻译、语音合成技术并不是非常成熟与完善,人工语音识别服务价格太高,希望低成本完成任务的我们只好使用自动转换机翻服务。但即使利用了ai技术,这也不是个简单的活。

因此技术组特地再试用了十几种方法后,采用了其中4种相对可行性较高的推荐给大家。

(1)讯飞听见(科大讯飞产品,中文语音识别技术雄厚,处于国内领先地位)


讯飞听见网页使用图

讯飞听见是科大讯飞(也就是最近世界AI大会上曝出AI同传包含人工环节的企业,虽然是丑闻,但从另一方面说明其资格)以及一系列衍生产品提供了语音转换的服务,上传文件后自动接单。

价格:机翻价格0.33元/每分钟,有点贵【刚注册有2个小时免费转换时长】

速度:自动识别,1小时音频5分钟出稿

识别率:经过试用有90%以上【官方:最高95%】

(实际上机翻识别率达90%以上就到了及格线,足以满足痛点。但再想从95%往上提高,边际效益和边际成本都非常高,这个痒点亟待技术去满足。不过近期科大讯飞声称自己的技术已经达到了98%的识别率,在可见的未来我们使用语音转换的效率会更高)

存在形式:网页、APP

https://www.iflyrec.com/

总结:效果最好的一个工具,如果能够报销(20元/小时)或者利用注册福利应该是比较好的选择

(2)录音啦

下载:

https://www.luyinla.com/

录音啦使用图

软件支持3个API接口、3个语种进行音频转文字的服务。

价格:按时间收费,价格适中,如下图【每台计算机半小时免费试用】


录音啦价格图

速度:自动识别,需等待一小段时间

识别率:综合来看在75~90%的区间,转换完了需要校对一遍,不过也省去了输入大部分文字的功夫,勉强可用(推荐云知声,试用下来识别率较高,在90%左右)

存在形式:PC端

总结:前期免费,目前开始收费,购买的都是目前国内比较有实力的语音识别产品的引擎,起到一个整合性服务的效果。总体来说比较有性价比,速度也不错,但精度不高还需人工校对

(3)speech to text

speech to text使用图

国外的语音转换产品,需要科学上网

价格:免费

速度:需要自动播放一遍,效率很低

识别率:70~80%,非常一般(注意语音模型改成普通话,关键词输入多一点,可以提高识别率)

存在形式:网页

https://speech-to-text-demo.ng.bluemix.net/

总结:虽然它需要fanqiang,虽然它需要自动放一遍,但是在目前的环境下免费的你还能说什么呢?不推荐,仅作为临时或小段语音转换时的工具

(4)有道云笔记

闲的没事做可以利用手机上微信、搜狗、百度、讯飞等语音输入APP一直按着输入,当然这样比较傻...

推荐使用有道云笔记语音速记功能,并且不需要一直点击。


有道云笔记使用图

价格:免费

速度:需要记录一遍,最长可支持60分钟

识别率:90%以上,效果比较好

存在形式:APP(独占语音速记功能)

总结:免费的总有这么多那么多的限制,但比起speech to text,有道云笔记的语音速记是一个更好的选择,除了你需要身边再放着一块手机

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349