1.前言
最近项目里面有段音频流需要代码控制音量大小,之前是直接推到服务器端用于语音识别的,由于多设备同时在运行,会存在串音的问题,因此各设备在设置页都增加了一个可滑动进度条,用于动态调解音频流音量的大小。
2.遇到问题
虽然之前并未接触过类似的知识点,但在网上找到了pcm音量控制这篇文章,文章看起来很高大上,不过我们需要用到的好像就是一个公式而已:
就是这么个东西,具体解释大家可以点击上面的文章链接看看原理,其中 A1 和 A2 是两个声音的振幅,此处的A2为原始音频振幅,A1为根据所指定db大小计算出来的调节音量后的音频振幅,画不多说,试试效果:
int db = -4;
private double factor = Math.pow(10,db / 20);
//调节PCM数据音量
//pData原始音频byte数组,nLen原始音频byte数组长度,data2转换后新音频byte数组,nBitsPerSample采样率,multiple表示Math.pow()返回值
public int amplifyPCMData(byte[] pData, int nLen, byte[] data2, int nBitsPerSample, float multiple)
{
int nCur = 0;
if (16 == nBitsPerSample)
{
while (nCur < nLen)
{
short volum = getShort(pData, nCur);
volum = (short)(volum * multiple);
data2[nCur] = (byte)( volum & 0xFF);
data2[nCur+1] = (byte)((volum >> 8) & 0xFF);
nCur += 2;
}
}
return 0;
}
private short getShort(byte[] data, int start)
{
return (short)((data[start] & 0xFF) | (data[start+1] << 8));
}
//把音频byte[]写入本地文件
public static void byte2file(String pathName, byte[] data) {
BufferedOutputStream bos = null;
File file = null;
try {
File dir = new File(Environment.getExternalStorageDirectory() + "/test/");
if (!dir.exists()) {//判断文件目录是否存在
dir.mkdirs();
}
file = new File(Environment.getExternalStorageDirectory() + "/test/" + pathName);
/* 使用以下2行代码时,不追加方式*/
/*bos = new BufferedOutputStream(new FileOutputStream(file));
bos.write(bfile); */
/* 使用以下3行代码时,追加方式*/
bos = new BufferedOutputStream(new FileOutputStream(file, true));
bos.write(data);
bos.flush();
} catch (Exception e) {
e.printStackTrace();
} finally {
if (bos != null) {
try {
bos.close();
} catch (IOException e1) {
e1.printStackTrace();
}
}
}
}
然后开始测试:
byte[] byteYuanNew = new byte[byteYuan.length];
amplifyPCMData(byteYuan,byteYuan.length,byteYuanNew,16,(float) factor);
//存入本地
byte2file("newdata.pcm", byteYuanNew);
通过不断调整db的值,来生成不同音量的pcm文件,db为0表示保持音量不变,db为负数表示较低音量,为正数表示提高音量,具体各位自行体会,声音调节步长最好是2db,然后把pcm音频文件导入到电脑上,用Audacity软件打开:
我通过调整db的值发现,当-2,-4······-14等等音量并未发生变化,-20突然变小,音量改变有点段落式变化,其实不难发现问题的出现就是在pow这个函数上。
3.解决
Math.pow(64,1/3)等价于 Math.pow(64,0),所以结果是1.0
在程序中,1/3并不代表三分之一,因为这里是两个int类型在做除法,结果也是int类型,会自动取整(向下取0了), 所以是0。
但其实我们真正想要的结果是0.3333333333333333333,和0的差距也太大了吧!
其实很简单的问题,还是java基础没打好,知道了问题所在,解决就很简单了:
private double factor = Math.pow(10, (double)db / 20);
在pow函数里,指数强转为double类型,然后数据自然误差就很小很小了。再次测试:
注意:本文并未处理数据溢出的情况,因为每个样本取值范围是有限制的,调节音量时不可能随便增大,比如一个signed 16 bits的样本,值为5000,我们放大10倍,由于有符号位16bits数据取值范围为-32768~32767,5000乘以10得到的50000超过了32767,数据溢出了,最后值可能变为-15536,不是我们期望的,解决方式点我;
源码:https://github.com/hanxiaofeng/pcmVideo
参考文章:
1.java Math类中的pow方法
2.PCM音量控制(高级篇)