基本
编码规则,定义在
ITU-T X.209 中,是指在 ASN.1 标准(定义在
ITU-T X.208 中)中描述的数据编码/解码规则。基本的
编码规则可能被用于为类型值取得传输语法的规范,使用 ASN.1 指定在推荐 X.208 中定义的。一单个 ASN.1 对象可能有几个等价的 BER 编码。BER 是当前 CryptoAPI 使用的两种编码方法之一。
简介
BER是一种编码规格说明,描述如何将 ASN.1 类型的值编码成字节串(string of octets)的方法。
SNMP使用的编码方法是BER(Basic Encoding Rule)。BER的数据都由三个域构成:标识域(tag)+长度域(length)+值域(value)。简称TLV格式。在ASN.1中,也称为Identifier-length-content(ILC)。
基于 BER 的 ASN1 编解码原理与设计实现
信令中继系统是电信 7 号信令网中基于事务处理能力( Transaction CAPabilities,简称 TCAP) 开发的系统, 它完成香港某电信虚拟运营商和其依赖的实际运营商之间信令消息的转换,在不需要建立新的国际漫游链路情况下,实现虚拟运营商的手机用户国际漫游的功能。TCAP 层的信令数据是由 ASN.1 定义的,使用 ASN.1 基本编码规则 BER( Basic Encoding Rules, 简称 BER) 进行传输,所以需要根据BER 进行解码和编码。
编解码模块内容
为了使编解码模块具有良好的通用性和扩展性,将其设计成标准 C 语言的函数库形式,这样可以在多种操作系统和多种编程语言中重用。ASN.1 编解码模块分为三个部分:( 1) 简单数据类型的编解码函数;( 2) 内存函数;( 3)辅助函数。
简单数据类型的编码函数为外部提供统一的 API 接口。信令转换模块利用这些函数对 TCAP 数据单元进行编码和解码,如果是复合类型,则分解成基本数据类型进行编码解码。
编码函数形式是:
int ASNEncode_< 数据类型> ( ASNCONTEXT* pCtx, < 数据类型对应的 C 结构> * pObj, int TagType) , 将 C 结构内的数据编码到缓冲区中。
解码函数形式是:
int ASNDecode_< 数据类型> ( ASNCONTEXT* pCtx, < 数据类型对应的 C 结构> * pObj, int TagType) , 将缓 冲区内的数据解码到数据结构中。
内存函数主要是进行内存的分配和管理。
辅助函数主要是进行编 解码错误的处理。
数据结构
为了能建立库函数之间的联系,需要跟踪函数调用时的有关参数,如编码解码缓冲区的变化、运行时的错误信息等。所以,在每个编解码函数里增加一个编解码上下文结构参数 ASNCONTEXT,以保证复合类型编解码和内存处理的正确性。定义了一个初始化上下结构的函数InitContext( ASNCONTEXT * ),在声明一个上下文结构的变量后,调用此函数上下文进行初始化,然后再调用编解码函数。
内存分配和管理
一般而言,C 语言中有下面两种方法进行内存分配:( 1) 在栈上分配变量,然后将变量的地址传给指针字段;( 2)使用标准的 malloc 和 free 两个C 函数
动态分配内存。第一种方法比较简单,可以得到临时内存,不再需要时可以释放。但是,这样很不安全,容易出现悬空指针。第二 种方法没有这个问题,在调用完编码函数后可以安全释放每个元素的内存。但是,对每个malloc 调用都要有free 调用。对于复杂的结构,很难做到这点,可能会导致内存泄漏。
采用的方法是使用库内存管理函数进行分配和释放内存缓冲区。相比第二种方法, 其最大的优点是只需调用一个简单的 MemFreeAll 函数就可以释放所有分配的内存。具体做法是, 在上下文结构中跟踪所有分配的内存, 当M emFreeAll 调用时,所有内存立刻释放。另外,
动态分配内存是从一小块连续内存池中分配,同时由一个 MEM_POOL结构记录内存池的起始地址、大小以及当前指针。最初,该指针指向内存池的开始处,分配内存时, 指针向前移动需要的长度。用这种方式分配的内存不会显式地释放,只有当指针重新设置为内存池的开始时才释放。释放的方法也很简单,只要赋值操作就可完成。
BER 编码是从缓冲区的结尾开始向前构造编码,编码完成后起始指针会落在缓冲区的中间。使用这样的编码技巧,可以方便地得到编码后数据的起始地址和长度。
对比
在网络通信中,大多数实际网络都采用了多个制造商的设备,这些设备所采用的“局部语法” (如:硬件体系结构、程序语言定义以及具体程序的编制等 )都是不一样的。这些差异就决定了同一数据对象在不同的计算机上被表示为不同的符号串。为了使多个制造商设备之间能够实现互通,就必须引入“传送语法”,它是一种标准的、与具体的网络环境无关的语法格式。对于传送语法的要求有以下三点:( 1)必须能够定义各种复杂的类型;( 2)必须能够精确说明这些类型的值;( 3)需要提供一种以上的编码规则,这种编码规则能够确定会话层用何种比特模式来表示应用层的数据的值。
PER与 BER的对比:
由于 BER的编码包含了过多的冗余信息,得网络传输负荷过大。ITU- T在 90年代初又制定了PER编码。X. 691中把 PER的编码又分为 alig nedv ariant 和 unaligned v ariant 这两种情况。其中,unalig ned va riant的编码都是按比特来的,各个数据项的编码之间没有填充的比特,因此它比 alig nedv ariant更为精简。但这种编码的结果没有从字节的边界处开始,实现起来不方便,而且也将占用更多的CPU时间。
与 BER编码比较,PER编码的精简主要来自于以下三方面:
没有T字段
T 字段在编码中似乎是一个重要部分,但实际上通常是不必要的。由于网络的通信双方都遵循统一的网络协议,因此它们可以从数据结构中推导出特定元素的类型和标识,就可以在编码中省略类型标识符。
长度段的编码更加精简
BER的长度段的编码都是字节,而且 BER长度的编码不考虑具体条件; 然而 PER的长度字段根据编码类型的不同,有不同的单位。这些单位可以是比特、字节、元素、字符等。 这也是 PER利用数据结构已知的优势来减少编码量的又一方式;而且根据具体的条件限制,PER的长度段还可以大幅度削减,譬如当数据类型的长度固定时,该数据项的长度甚至可以不编码。 IA5String ( SIZE( 4) ): : = “ BCDA”,由于长度固定为 4,PER编码就只对 BCDA进行编码,共 4字节。而 BER则还要包括 T和 L字段,共 6字节。
PER长度段的编码规则也要复杂得多,这方面的论述在 X. 691中占据了相当大的篇幅。
对数字类型的编码更加精简
在对 Integer 等数字类型 (包括 Integ er和一些类型的长度值编码的情况 )进行编码时,BER采取的是直接对数值进行编码;而 PER采取的是对数据的偏移值 ( offset)进行编码。所谓偏移值就是实际值减去下界的值。Integer ( 123456789…123456792): : = 123456790,o ffset= 1,PER只需要对 1进行编码,编码结果为“ 01”,占两个比特。而PER就要对 1234567690进行编码,编码结果为包括 TLC三个字段共需要 6个字节。这样对于那些下界类型很大的整数,可以节省大量字节,且编码本身也非常简洁。