VO
IP ,即指在 IP 网络上使用 IP 协议以
数据包的方式传输语音。使用 VOIP 协议,不管是
因特网、企业内部互连网还是
局域网都可以实现语音通信。一个使用 VOIP 的网络中,
语音信号经过数字化,压缩并转换成 IP 包,然后在 IP 网络中进行传输。 VOIP 信令协议用于建立和取消呼叫,传输用于定位用户以及协商能力所需的信息。电话网络的主要特点是低成本;数据、语音和视频在同一网络上的合成;
集中式网络上的
新服务以及对
终端用户的简单化管理。
协议概括
存在一些
VOIP 协议栈,它们源于各种标准团体和提供商,如
H.323、SIP、MEGACO 和 MGCP。
H.323 是一种
ITU-T 标准,最初用于
局域网(LAN)上的
多媒体会议,后来扩展至覆盖 VOIP。该标准既包括了
点对点通信也包括了多点会议。H.323 定义了四种逻辑组成部分:终端、网关、关守及
多点控制单元(
MCU)。终端、网关和 MCU 均被视为终端点。
会话发起协议(SIP)是建立 VOIP 连接的
IETF 标准。SIP 是一种
应用层控制协议,用于和一个或多个参与者创建、修改和终止会话。SIP 的结构与
HTTP (客户-服务器协议)相似。
客户机发出请求,并发送给服务器,服务器处理这些请求后给客户机发送一个响应。该请求与响应形成一次事务。
媒体网关控制协议(MGCP)是由 Cisco 和 Telcordia 提议的 VO
IP 协议,它定义了
呼叫控制单元(呼叫代理或
媒体网关)与电话网关之间的通信服务。MGCP 属于控制协议,允许中心
控制台监测 IP 电话和网关事件,并通知它们发送内容至指定地址。在 MGCP 结构中,智能呼叫控制置于网关外部并由呼叫
控制单元(呼叫代理)来处理。同时呼叫控制单元互相保持同步,发送一致的命令给网关。
媒体网关控制协议(Megaco)是 IETF 和
ITU-T (ITU-T 推荐
H.248)共同努力的结果。
Megaco/H.248 是一种用于控制物理上分开的多媒体网关的协议单元的协议,从而可以从媒体转化中分离
呼叫控制。Megaco/H.248 说明了用于转换
电路交换语音到基于包的
通信流量的媒体网关(MG)和用于规定这种流量的服务逻辑的媒介网关控制器之间的联系。Megaco/H.248 通知 MG 将来自于
数据包或
单元数据网络之外的
数据流连接到数据包或单元数据流上,如
实时传输协议(RTP)。从 VOIP 结构和网关控制的关系来看, Megaco/H.248 与 MGCP 在本质上相当相似,但是 Megaco/H.248 支持更广泛的网络,如 ATM。
主要问题
在过去的几年里, VOIP 产业一直致力于下面几个主要问题:
语音质量
――由于 IP 是用来传输数据的,所以它不能提供
实时性保证,只能提供最有效的服务。为使用户可以接受 IP 上的语音通信,数据包延时需要小于一个
极限值。
互用性
――在公共
网络环境下,不同提供商的产品需要相互之间进行操作,推动 VOIP 更广泛的应用。
安全性
――利用加密(如
SSL)和隧道(
L2TP)技术保护 VOIP 信令及控制流量。
――
因特网电话技术虽已引入,但它需与 PSTN 在可预见的将来能够
协同工作。网关技术用于连接这两个网络。
―― VOIP 需要足够灵活,能与日渐增长的私有和公有用户市场共同成长。为解决上述问题,许多
网络管理和
用户管理技术正在逐步形成。
协议术语
VOIP 协议 (VOIP definition)
VOIP
— 语音
传输协议(又称为IP电话技术,
网络电话技术以及数位电话) — 即通过电脑或其它基于IP的网络来传输语音对话的路径。
SIP
—
会话初始化协议——是由IETF的MMUSIC工作组研发并应用于标准初始化,修改,以及终止的视频,语音,实时信息传送,线上游戏以及虚拟现实等多媒体组件的互动用户协议。
PSTN
—
公共交换电话网络 - 世界公共线路的集合 — 交换电话网络,如同
网际网络是世界公共IP电话资料包传输的集合点。
ISDN
- 集成服务数字网络 —网络电话转换线路系统的一种,通过普通的
电话铜线传输数字(相对于模拟)语音和资料,以获得比
模拟系统更好的通话音质和更流畅的
传输速度。
PBX
— 企业内部电话
交换系统(也叫做企业通信交换系统)—
私人企业所有的电话
传输系统,与此对立的是公共承运人或电话公司所有的电话传输系统
ⅣR
——在电话技术领域里,互动语音回应 — 是指电算化系统允许个人,例如电话呼叫者按照语音菜单中的选项操作,换句话说,是指个人与
计算机系统进行互动。
DID
——直接拨入(也叫做欧洲直接拨入)是电话公司提供的客户端部件,用于企业间的通信交换系统,由电话公司(电信)收集所有连接到客户的企业通信交换机(PBX)上的号码。
RFC
— 请求说明(复数形式为RFCs) 是因特网和Unix社区的
商业软件和免费软件中网络数码
信息文件和标准所广泛遵训的 的系列之一一。
关键技术
传统的IP 网络主要是用来传输
数据业务,采用的是尽力而为的、
无连接的技术,因此没有
服务质量保证,存在分组丢失、失序到达和
时延抖动等情况。数据业务对此要求不高,但话音属于实时业务,对时序、
时延等有严格的要求。因此必须采取特殊措施来保障一定的业务质量。VOIP 电话/
VOIP网络电话的
关键技术包括:
信令技术、编码技术、实时
传输技术、服务质量(QoS)保证技术、以及
网络传输技术等。
信令技术
信令技术保证电话呼叫的顺利实现和话音质量,被广泛接受的VoIP 控制信令体系包括ITUT
的H.323 系列和IETF 的
会话初始化协议SIP。
ITU的H.323 系列建议定义了在无业务质量保证的因特网或其它分组网络上多媒体通信的协议及
其规程。H.323 标准是局域网、
广域网、INTRANET 和Internet 上的多媒体提供技术基础保障。
H.323 是ITU-T 有关多媒体通信的一个
协议集,包括用于ISDN 的
H.320,用于B-ISDN 的H.321
和用于PSTN 终端的H.324 等建议。其
编码机制,协议范围和基本操作类似于ISDN 的Q.931 信令
协议的简化版本,并采用了比较传统的电路交换的方法。相关的协议包括用于控制的
H.245,用于
建立连接的H.225.0,用于大型会议的H.332,用于
补充业务的H.450.1、H.450.2 和H.450.3,有关安
全的
H.235,与电路交换业务
互操作的H.246 等。H.323 提供设备之间、高层应用之间和提供商之
间的
互操作性。它不依赖于
网络结构,独立于操作系统和硬件平台,支持多点功能、组播和带宽管
理。H.323 具备相当的灵活性,支持包含不同功能的节点之间的会议和不同网络之间的会议。H.323
建议的
多媒体会议系统中的
信息流包括音频、视频、数据和
控制信息。信息流采用H.225.0 建议
方式来打包和传送。
H.323
呼叫建立过程涉及到三种信令:RAS 信令(R=注册:Registration、A=许可:Admission和S=状态:Status),H.225.0 呼叫信令和H.245 控制信令。其中RAS 信令用来完成终端与
网守之间的登记注册、
授权许可、带宽改变、状态和脱离解除等过程;H.225.0 呼叫信令用来建立两
个终端之间的连接,这个信令使用Q.931 消息来控制呼叫的建立和拆除,当系统中没有网守时,呼叫
信令信道在呼叫涉及的两个终端之间打开;当系统中包括一个网守时,由网守决定在终端与网守
之间或是在两个终端之间开辟呼叫信令信道;H.245 控制信令用来传送终端到终端的控制消息,
包括主从判别、能力交换、打开和关闭
逻辑信道、模式参数请求、流控消息和通用命令与指令等。
H.245 控制信令信道建立于两个终端之间,或是一个终端与一个网守之间。
虽然H.323 提供了
窄带多媒体通信所需要的所有子协议,但H.323 的控制协议非常复杂。此
外,H.323 不支持多点发送(Multicast)协议,只能采用
多点控制单元(MCU)构成多点会议,因
而同时只能支持有限的多点用户。H.323 也不支持
呼叫转移,且建立呼叫的时间比较长。与H.323
相反,SIP 是一种比较简单的
会话初始化协议。它不像H.323 那样提供所有的
通信协议,而是只提
供会话或呼叫的建立与控制功能。SIP 可以应用于多媒体会议、远程教学及Internet 电话等领域。
SIP 既支持单点发送(Unicast)也支持多点发送,会话参加者和媒体种类可以随时加入一个已存在
的会议。SIP 可以用来呼叫人或
机器设备,如呼叫一个媒体
存储设备记录一个会议,或呼叫一个点
SIP 是一种应用层协议,可以用
UDP 或
TCP 作为其传输协议。与H.323 不同的是:SIP 是一种基
于文本的协议,用SIP 规则
资源定位语言描述(SIP Uniform Resource Locators),这样易于实现和
调试,更重要的是灵活性和扩展性好。由于SIP 仅作于初始化呼叫,而不是
传输媒体数据,因而造成
的附加传输代价也不大。SIP 的URLL 甚至可以嵌入到web 页或其它
超文本链路中,用户只需用
鼠标一点即可发出一个呼叫。与H.323 相比,SIP 还有建立呼叫快,支持传送
电话号码的特点
编码技术
话音
压缩编码技术是VOIP 电话/VOIP 网络电话技术的一个重要组成部分。主要的编码技术
有ITU-T 定义的
G.729、
G.723(
G.723.1)等。其中G.729 可将经过采样的64kbit/s 话音以几乎不
失真的质量压缩至8kbit/s。由于在
分组交换网络中,业务质量不能得到很好保证,因而需要话音的
编码具有一定的灵活性,即编码速率、编码尺度的可变可适应性。G.729 原来是8kbit/s 的话音编
码标准,
工作范围扩展至6.4~11.8kbit/s,话音质量也在此范围内有一定的变化,但即使是
⒍4kbit/s,话音质量也还不错,因而很适合在VoIP 系统中使用。G723.1 采用5.3/6.3K bit/s 双速率话
音编码,其话音质量好,但是处理时延较大,它是已标准化的最低速率的话音编码算法。
实时传输技术
实时传输技术主要是采用实时传输协议RTP。RTP 是提供端到端的包括音频在内的
实时数据传
送的协议。RTP 包括数据和控制两部分,后者叫RTCP。RTP 提供了时间标签和控制不同数据流同
步特性的机制,可以让接收端重组发送端的数据包,可以提供接收端到多点发送组的服务质量反
馈。
服务质量(QoS)保证技术
VOIP 电话/VOIP 网络电话中主要采用
资源预留协议(RSVP)以及进行服务
质量监控的实时传输控
网络传输技术
VOIP 电话/VOIP 网络电话中网络传输技术主要是TCP 和UDP,此外还包括网关互联技术、路由
选择技术、网络管理技术以及
安全认证和计费技术等。由于实时传输协议RTP 提供具有实时特
征的、端到端的
数据传输业务,因此VOIP 电话/VOIP 网络电话中可用RTP 来传送话音数据。在
RTP
报头中包含装载数据的
标识符、序列号、
时间戳以及传送监视等,通常RTP 协议数据单元是
用UDP 分组来承载,而且为了尽量减少时延,话音
净荷通常都很短。IP、UDP 和RTP 报头都按最
小长度计算。VoIP 话音分组开销很大,采用RTP 协议的VOIP 电话/VOIP 网络电话格式,在这种方
式中将多路话音插入话音
数据段中,这样提高了
传输效率。此外,静音
检测技术和
回声消除技术也
是VOIP 电话/VOIP 网络电话中十分关键的技术。静音检测技术可有效剔除静默信号,从而使话音
信号的
占用带宽进一步降低到3.5kbit/s 左右;回声消除技术主要利用
数字滤波器技术来消除对
通话质量影响很大回声干扰,保证通话质量。
代表产品
VOIP手机
VoIP手机也叫
VoIP双模手机或者简称IP手机,它完美融合GSM和WiFi,双模同时待机,共享用户资料。作为普通手机,有了它,用户可以在没有WiFi环境的时候使用传统的
G网服务,包括打电话、发短信彩信、GPRS上网等;在任何有
无线网络的地方人们可以用它享受免费的高速
网上冲浪,
IM聊天,收发电子邮件等新潮
移动技术,更重要的是,人们利用voip双模手机可以通过网络,以超低的价格拨打普通电话和手机,
voip手机之间通过网络互相通话更是免费的,且无需运营商的支持,同时简单通过
手机终端就能实现3方通话。作为PDA手机,voip双模手机在使用上有很多智能化的贴心设计,包括
手写输入、个人信息管理、常用文档格式阅读和编辑、以及拍摄高象素的数码图片等等。
派锐天科
双模手机是全球首款基于
SIP协议的Window Mobile 6.0双模终端产品。它具有如下独特的功能:
200万像素 CMOS 摄像头
三频: 900/1800/1900MHz
支持EDGE
GSM与VoWLAN同时待机
可同时接听GSM和VoWLAN电话
自动或手动转换使用GSM/VoWLAN呼出电话
自动或手动转换使用GPRS/WLAN进行数据应用
支持IEEE 802.11b/g
支持基于SIP协议的GSM/VoWLAN通话切换