在给定的直角坐标系上,坐标全是整数的点,叫做整点;全部整点构成的组就叫做空间格网。在空间网格里的运算称为
定点运算。除定点运算外的当然就是浮点运算。
简介
定点数:通俗的说,小数点固定的数。以人民币为例,我们日常经常说到的如123.45¥,789.34¥等等,默认的情况下,小数点后面有两位小数,即角,分。如果小数点在最高有效位的前面,则这样的数称为纯小数的定点数,如0.12345,0.78934等。如果小数点在最低有效位的后面,则这样的数称为纯整数的定点数,如12345,78934等。
表示数的一种方法,其中小数点的位置是固定的。在表示一个数时,小数点一般固定在数的最高位之前,使得数(即尾数或数码)的绝对值小于1,它的形式为数符·尾数。对整型数,小数点固定在数的最低位。用定点表示法表示的数,称为定点数。
浮点数:一般说来,小数点不固定的数。比较容易的理解方式是,考虑以下我们日常见到的
科学记数法,拿我们上面的数字举例,如123.45,可以写成以下几种形式:12.345x1011;2345x1020;12345x103为了表示一个数,小数点的位置可以变化,即小数点不固定。
资料中、小型计算机和微型计算机在用于仿真计算或作为专用控制机时,为了保讯计算速度,在语言上多采用汇编语言,在点制上多采用定点数。用定点数计算,要 求参与运算的各量无论是初值或中间结果、最后结果的值都必须严格地限制在(-1,+1)区间内,否则在运算过程中会产生溢出。
DSP芯片的定点运算
在定点
DSP芯片中,采用
定点数进行数值运算,其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于
DSP芯片所给定的字长,一般为16位或24位。显然,字长越长,所能表示的数的范围越大,
精度也越高。如无特别说明,本书均以16位字长为例。 DSP芯片的数以2的
补码形式表示。每个16位数用一个符号位来表示数的正负,0表示数值为正,1则表示数值为负。其余15位表示数值的大小。
因此 ,二进制数0010000000000011b=8195 二进制数1111111111111100b=-4 对
DSP芯片而言,参与数值运算的数就是16位的整型数。但在许多情况下,数学运算过程中的数不一定都是整数。那么,DSP芯片是如何处理
小数的呢?应该说,DSP芯片本身无能为力。那么是不是说DSP芯片就不能处理各种
小数呢?当然不是。这其中的关键就是由程序员来确定一个数的
小数点处于16位中的哪一位。这就是数的定标。 通过设定小数点在16位数中的不同位置,就可以表示不同大小和不同
精度的小数了。数的定标有Q表示法和S表示法两种。表3.1列出了一个16位数的16种Q表示、S表示及它们所能表示的
十进制数值范围。 从表3.1可以看出,同样一个16位数,若小数点设定的位置不同,它所表示的数也就不同。例如: 16
进制数2000H=8192,用Q0表示 16进制数2000H=0.25,用Q15表示 但对于DSP芯片来说,处理方法是完全相同的。 从表3.1还可以看出,不同的Q所表示的数不仅范围不同,而且
精度也不相同。Q越大,数值范围越小,但
精度越高;相反,Q越小,数值范围越大,但精度就越低。例如,Q0的数值范围是-32768到+32767,其
精度为1,而Q15的数值范围为-1到0.9999695,精度为 1/32768 = 0.00003051。因此,对
定点数而言,数值范围与
精度是一对矛盾,一个变量要想能够表示比较大的数值范围,必须以牺牲精度为代价;而想提高精度,则数的表示范围就相应地减小。在实际的定点
算法中,为了达到最佳的性能,必须充分考虑到这一点。
浮点数与
定点数的转换关系可表示为:
浮点数(x)转换为
定点数( ): 定点数( )转换为浮点数(x): 例如,浮点数 x=0.5,定标 Q=15, 表示下取整。反之,一个用 Q=15 表示的
定点数16384,其
浮点数为16384×2-15 =16384/32768=0.5。
从浮点到定点
在编写DSP模拟算法时,为了方便,一般都是采用
高级语言(如C语言)来编写模拟程序。程序中所用的变量一般既有整型数,又有
浮点数。如例3.1程序中的变量i是整型数,而pi是
浮点数,hamwindow则是浮点数组。
例3.1 256点汉明窗计算
inti;
floatpi=3.14159;
floathamwindow[256];
for(i=0;iQy,
加法/
减法结果z的定标值为Qz,则
z=x+yÞ
=Þ
intx,y,z;
longtemp;
temp=y>(Qx-Qz)),若Qx≥Qz
z=(int)(temp>2)=29491;
因为z的Q值为13,所以定点值z=29491即为
浮点值z=29491/8192=3.6。
例3.3定点减法
设x=3.0,y=3.1,则浮点运算结果为z=x-y=3.0-3.1=-0.1;
Qx=13,Qy=13,Qz=15,则定点减法为:
x=24576;y=25295;
temp=25395;
temp=x-temp=24576-25395=-819;
因为QxQy,
加法结果z的定标值为Qz,则定点加法为:
intx,y;
longtemp,z;
temp=y>(Qx-Qz),若Qx≥Qz
z=temp32767,因此
x=30000;y=20000;
temp=20000>1=35000;
因为z的Q值为0,所以定点值z=35000就是浮点值,这里z是一个长整型数。
当加法或加法的结果超过16位表示范围时,如果程序员事先能够了解到这种情况,并且需要保证运算
精度时,则必须保持32位结果。如果程序中是按照16
位数进行运算的,则超过16位实际上就是出现了溢出。如果不采取适当的措施,则数据溢出会导致运算精度的严重恶化。一般的定点
DSP芯片都设有溢出保护功能,当溢出保护功能有效时,一旦出现溢出,则累加器ACC的结果为最大的饱和值(
上溢为7FFFH,
下溢为8001H),从而达到防止溢出引起
精度严重恶化的目的。
3.2.2乘法运算的C语言定点模拟
floatx,y,z;
z=xy;
假设经过统计后x的定标值为Qx,y的定标值为Qy,乘积z的定标值为Qz,则
z=xyÞ
=Þ
=
所以定点表示的乘法为:
intx,y,z;
longtemp;
temp=(long)x;
z=(temp×y)>>(Qx+Qy-Qz);
例3.5定点乘法
设x=18.4,y=36.8,则
浮点运算值为z=18.4×36.8=677.12;
根据上节,得Qx=10,Qy=9,Qz=5,所以
x=18841;y=18841;
temp=18841L;
z=(18841L*18841)>>(10+9-5)=354983281L>>14=21666;
因为z的定标值为5,故定点z=21666即为浮点的z=21666/32=677.08。
floatx,y,z;
z=x/y;
假设经过统计后
被除数x的定标值为Qx,除数y的定标值为Qy,商z的定标值为Qz,则
z=x/yÞ
=Þ
所以定点表示的除法为:
intx,y,z;
longtemp;
temp=(long)x;
z=(temp
constintlength=180
voidfilter(intxin[],intxout[],intn,floath[]);
staticfloath[19]=
{0.01218354,-0.009012882,-0.02881839,-0.04743239,-0.04584568,
-0.008692503,0.06446265,0.1544655,0.2289794,0.257883,
0.2289794,0.1544655,0.06446265,-0.008692503,-0.04584568,
-0.04743239,-0.02881839,-0.009012882,0.01218354};
staticintx1[length+20];
voidfilter(intxin[],intxout[],intn,floath[])
{
inti,j;
floatsum;
for(i=0;i
constintlength=180;
voidfilter(intxin[],intxout[],intn,inth[]);
staticinth[19]={399,-296,-945,-1555,-1503,-285,2112,5061,7503,8450,
7503,5061,2112,-285,-1503,-1555,-945,-296,399};
staticintx1[length+20];
voidfilter(intxin[],intxout[],intn,inth[])
{
inti,j;
longsum;
for(i=0;i>15;
}
for(i=0;i<(n-1);i++)x1[n-i-2]=xin[length-i-1];
}
主程序与浮点的完全一样。