之前我们介绍了两款免费音视频通信系统关于ios demo的搭建,今天我们继续来介绍windows demo的搭建,首先来给大家介绍webrtc。
Webrtc
Webrtc(webrtc.org)的编译对于开发主机的性能,网络带宽的要求都非常高。另外,在Windows平台下,它对Windows的系统版本,Visual Studio 版本也都有明确的要求,只要其中某一项出问题了,都可能导致失败。因此在准备环节需要确定主机和系统配置。
一、准备
1. 要求
1)安装好VPN,确保网络顺畅
2)64位机器、8G及以上内存、100G及以上磁盘空间、NTFS格式;
1)安装Visual Studio 2015 Update 3
4)操作系统:Windows7 及以上的英文版本(注意windows只能是英文版本)
2. 下载depot-tools
下载地址:https://storage.googleapis.com/chrome-infra/depot_tools.zip
注意设定好解压文件夹,要不当前文件夹会文件太多弄混。
3.配置depot-tools环境变量
计算机——属性——高级——环境变量——path
注意:必须将它放在path环境变量的开头
4. 将depot-tools配置到系统环境变量里
depot_tools 使用 Google 内部版本。
二、下载源码
1. 创建webrtc目录:
mkdir webrtc-checkout
cd webrtc-checkout
fetch --nohooks webrtc
2. 你可以选择的目录:
git config branch.autosetupmerge always
git config branch.autosetuprebase always
3. 或者创建新的目录:
cd src
git checkout master
git new-branch your-branch-name
gclient sync
三、编译
1. 获取Ninja工程文件:https://ninja-build.org/
Ninja是Chromium社区开发的一套build system,非常适合webrtc
2. 执行下面的命令进行WebRTC编译
cd src
gn gen out/Default
3. 编译成功后,执行下面的命令生成vs工程文件
gn gen--ide=vs out\Default
这时,我们就可以在 src\out\Default\ 目录下找到 all.sln 这个工程文件。因为webrtc的文档很多,强烈建议大家上webrtc的官网,根据官网的步骤一步一步操作,不要着急。
https://webrtc.org/native-code/development/
说完webrtc的方案,接下来我们看看tucodec
Tucodec
一、准备:
1、首先在图鸭官网:http://tucodec.com 进行注册,获得SDK中所需要的APPKey、AppSecret,注册登录后如下图所示:
点击SDK下载按钮跳转到下载界面,选择下载Windows中所需SDK和Demo
如图所示我们提供了vs2013版本和vs2015版本的SDK及相应的WinDemo
下载visual studio开发工具并安装,因为vs2013和vs2015自带的一些库和编译选项有些许不同,所以必须选择与SDK匹配的VS工具进行开发
安装完成后双击打开图3中的WinDemo.sln,便可以看到下图的工程界面,把生成类型调整为Debug/x86,然后编译WinDemo项目
在vs中点击“本地调试器”即可运行本demo,main函数的两个参数已在工程配置选项中赋予,如下图
或者手动将opencv和Tucodec_SDK_Windows的bin目录下的文件拷贝到exe所在的目录。然后在该文件夹下打开“命令提示符”或者“Windows PowerShell”,在命令行下面赋予WinDemo.exe两个参数,分别是自己的ID和对方的ID,然后运行即可。如下图
Tucodec的Windows编译相对比Webrtc更加简单,为了让开发者们能够弄懂其中的逻辑,除了编译外,笔者还将这一WinDemo做简单介绍。
二、WinDemo介绍
总的来说,Windows端的音视频通信系统主要包括音视频采集、音视频播放和VoIP负责的音视频传输三个模块。利用tucodec的SDK及由图鸭开源的转发服务器代码(www.tucodec.com),开发者可以搭建自己的音视频通信服务器。因此,开发者主要面对的问题就是Windows端的音视频采集与播放问题。
1. 视频采集和播放
有经验的开发者看到压缩包内的opencv目录便知道了在本Demo中对视频的处理借助了opencv的帮助,其优点是可以非常方便的进行视频采集和播放,为开发者屏蔽了与Windows硬件交互的诸多繁杂任务。Demo中的CVideoCap和CVideoRender两个类就是利用了opencv库进行视频的采集和渲染。
当然,opencv有一个比较大的缺点儿就是耗费系统资源比较多,如果电脑配置一般的话会发现开启opencv渲染视频后电脑的CPU负荷会出现大幅上涨。所以如果想把图鸭的SDK用于产品研发的话,推荐你们自己来实现客户端的采集和播放功能,常用的有DirectShow,SDL,DirectX SDK等官方提供的SDK。
2. 音频采集和播放
由于opencv不能完成音频相关的处理任务,所以Demo中使用了微软提供的Windows MultiMedia相关API完成音频采集和渲染功能,详见Demo中的CAudioCap和CAudioRender两个类。
音视频采集与播放的类关系如下图所示:
3. CVoipManager类
这个类封装了音视频操作与VoIP之间的交互,是整个Demo的核心部分。其类图如下所示:
部分方法和属性介绍:
m_clientNetwork:ClientNetwork实例,负责转发服务器的登录
m_voip:TYVoip实例,负责打通数据传输
m_voipCallback:TYVoip中的接口实现,是voip的视频回调接口,客户端从这个类中获得voip传过来的视频数据
m_selfID:本地的usrID
m_sessionID:会话ID
m_audioCap,m_audioRender,m_videoCap,m_videoRender:音视频采集渲染
m_ac,m_ai,m_vc,m_vi:音视频格式配置
m_nodeList:添加的通信节点列表
LoginServer:登录转发服务器(转发服务器需要提前配置好),因为是通过转发服务器做数据传输或P2P打洞,所以在添加对方为节点的时候要保证两者都是在线状态,当然这个在登录模块做了处理,如果对方还没上线会一直请求下去。
AddNote:添加一个通信节点
RemoveNote:移除一个通信节点
StartVoipTransmit:开始音视频采集和渲染以及传输
EndVoipTransmit:结束音视频采集和渲染以及传输
总结
随着 webrtc的开源,它受到越来越多开发者的喜爱,但是几个G的源代码也常常让程序猿们伤透了脑筋。小编建议大家可以参考github上其他团队的编译结果,当然最好还是还是选择自己上官网下载、编译,毕竟搜索出来的编译结果相对都比较陈旧,不太符合开发需求。
至于Tucodec则给了国内开发者又一新选择,但是由于是刚刚出现没多久的产品,文档不够丰富,给编译也增加了一定难度。大家可以搜索看看能不能加入他们的技术交流群,和其公司技术人员交流,以此加快编译问题的解决。