视频会议终端实际上也就是多媒体通信终端设备,人们借助终端参与视频会议。试想一下,在视频会议中我们需要哪些设备?摄像头、显示设备、麦克风、音响、传输网络,有时候还需要在会议中共享文件、影像等资料。那么,视频会议终端是如何将这些设备有机地结合在一起,通过什么机制实现终端的互通,以达到异地实时交流沟通的目的呢?
H323终端框架
下面我们以H.323终端为例深入了解视频会议终端。H.323终端的组成框架如图1所示。
图 1 H.323终端的组成框架
上图中的术语和缩略语解释说明如下:
术语/缩略语名称说明
I/O Input/Output,输入/输出。
H.245 媒体通信控制协议,规定了具体的通信控制信令。
H.225 呼叫信令协议,以及包交换网络中的媒体打包标准。
RAS Registration, Admission and Status,注册、许可与状态。
RAS信令用来实现端点(终端、网关GW、MCU)与网守GK间的认证。
RTP Real-time Transport Protocol,实时传输协议。
规定了在网络传输中的音频和视频的标准数据包格式。
TCP Transmission Control Protocol,传输控制协议。
提供可靠的连接服务:在正式收发数据前,必须和对方建立可靠的连接。
UDP User Data Protocol,用户数据报协议。
提供非可靠的连接服务:不与对方建立连接,直接发送数据包。
在如图1所示的H.323终端组成框架中,各个部分的功能说明如下。
1. 视频编解码器:对来自视频源(比如摄像机)的视频进行编码发送,对接收到的视频码进行解码并输出到视频显示设备(比如电视机)。
2. 音频编解码器:对来自音频源(比如麦克风)的音频信号进行编码发送,对接收到的音频码进行解码并输出到音频输出设备(比如音响、扬声器)。
3. 数据信道:支持远程信息处理应用,比如电子白板、静态图像传输、文件交换、数据库访问、音频图形会议等。实时音频图形(Audio Graphics)会议的标准数据应用采用的是
T.120标准。
4. 系统控制单元:为H.323终端的正确操作提供信令。它提供呼叫控制、能力交换、命令和指示的信令、以及消息。
5. 接收通路时延:在接收处理路径上为保持与其它媒体的同步,媒体流可以被延时。对于网络延时(引起分组到达抖动),媒体流也可以被延时。
6.
H.225.0层:对发送的视频、音频、数据和控制流进行格式化,形成消息输出到网络接口;同时,从网络接口接收到的消息中提取视频、音频、数据和控制流。
7. 分组网络接口:将封装后的数据流转换成可以在各种传输网络上传递的码流,并输出到网络中传递。
其中,系统控制单元、H.225.0层、网络接口和音频编解码器单元是H.323终端必备的单元;视频编解码器单元和数据应用是H.323终端可选的单元。
视频会议终端根据不同的网络所采用的标准有所不同,主要表现在“复用控制”(如H.323终端的H.225.0层)及“通信接口”(如H.323终端的分组网络接口)模块的不同。此外,所使用的视频、音频处理的标准也有所差别,但实现的功能都是相同的。事实上,视频会议终端的主要工作是:将本地的视频、音频、数据和控制信息进行编码打包并发送;对收到的数据包解码还原为视频、音频、数据和控制信息。
最后比较一下硬件视频会议终端和新兴的软件视频会议终端的优劣之处。与软件视频会议终端相比,硬件视频会议终端的成本相对高、设备相对复杂,但是它的视频和音频质量高、扩展性好、稳定性强,在相当长的一段时间里是视频会议终端的主流。