欢迎来到天天文库
浏览记录
ID:55146191
大小:259.13 KB
页数:19页
时间:2020-04-28
《浮点转定点方法总结.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、CIITechnologies,Inc.浮点转定点方法总结浮点转定点方法总结—孔德琦19CIITechnologies,Inc.目录目录定点运算方法31.1数的定标31.2c语言:从浮点到定点41.2.1加法41.2.2乘法61.2.3除法71.2.4三角函数运算81.2.5开方运算91.3附录101.3.1附录1:定点函数库101.3.2附录2:正弦和余弦表2819CIITechnologies,Inc.浮点转定点方法总结定点运算方法1.1数的定标对某些处理器而言,参与数值运算的数就是16位的整型数。但在许多情况下,数学运算过程中的数不一定都是整数。那么,如何处
2、理小数的呢?应该说,处理器本身无能为力。那么是不是就不能处理各种小数呢?当然不是。这其中的关键就是由程序员来确定一个数的小数点处于16位中的哪一位。这就是数的定标。通过设定小数点在16位数中的不同位置,就可以表示不同大小和不同精度的小数了。数的定标用Q表示法。表1.1列出了一个16位数的16种Q表示能表示的十进制数值范围和近似的精度。Q表示精度(近似)十进制数表示范围Q150.00002-1≤X≤0.9999695Q140.00005-2≤X≤1.9999390Q130.0001-4≤X≤3.9998779Q120.0002-8≤X≤7.9997559Q110.0
3、005-16≤X≤15.9995117Q100.001-32≤X≤31.9990234Q90.002-64≤X≤63.9980469Q80.005-128≤X≤127.9960938Q70.01-256≤X≤255.9921875Q60.02-512≤X≤511.9804375Q50.04-1024≤X≤1023.96875Q40.08-2048≤X≤2047.9375Q30.1-4096≤X≤4095.875Q20.25-8192≤X≤8191.75Q10.5-16384≤X≤16383.5Q01-32768≤X≤32767表1.1Q表示、S表示及数值范围从表1
4、.1可以看出,同样一个16位数,若小数点设定的位置不同,它所表示的数也就不同。例如:16进制数2000H=8192,用Q0表示16进制数2000H=0.25,用Q15表示从表1.1还可以看出,不同的Q所表示的数不仅范围不同,而且精度也不相同。Q越大,数值范围越小,但精度越高;相反,Q越小,数值范围越大,但精度就越低。例如,Q0的数值范围是-32768到+32767,其精度为1,而Q15的数值范围为-1到0.9999695,精度为19CIITechnologies,Inc.浮点转定点方法总结1/32768=0.00003051。因此,对定点数而言,数值范围与精度是一
5、对矛盾,一个变量要想能够表示比较大的数值范围,必须以牺牲精度为代价;而想提高精度,则数的表示范围就相应地减小。在实际的定点算法中,为了达到最佳的性能,必须充分考虑到这一点。浮点数与定点数的转换关系可表示为:浮点数(x)转换为定点数():定点数()转换为浮点数(x):例如,浮点数x=0.5,定标Q=15,则定点数=,式中表示下取整。反之,一个用Q=15表示的定点数16384,其浮点数为16384×2-15=16384/32768=0.5。1.2c语言:从浮点到定点下面所描述的几种基本运算是浮点到定点转换中经常遇到的,从中可以体会到一些基本的技巧和方法。1.2.1加法
6、设浮点加法运算的表达式为:floatx,y,z;z=x+y;将浮点加法/减法转化为定点加法/减法时最重要的一点就是必须保证两个操作数的定标值一样。若两者不一样,则在做加法/减法运算前先进行小数点的调整。为保证运算精度,需使Q值小的数调整为与另一个数的Q值一样大。此外,在做加法/减法运算时,必须注意结果可能会超过16位表示,即数的动态范围。如果加法/减法的结果超出16位的表示范围,则必须保留32位结果,以保证运算的精度。1.结果不超过16位表示范围设x的Q值为Qx,y的Q值为Qy,且Qx>Qy,加法/减法结果z的定标值为Qz,则z=x+yÞ==Þ一般情况,我们取x,
7、y和z的定标值相同,即Qx=Qy=Qz=Qa。所以定点加法可以描述为:shortx,y,z;//Qaz=add(x,y);//Qa19CIITechnologies,Inc.浮点转定点方法总结函数add()有防饱和机制,如果可以确信x+y不会溢出(-2^15<=z<=2^15-1),可以直接写为z=x+y.定点减法:shortx,y,z;//Qaz=sub(x,y);//Qa函数sub()有防饱和机制,如果可以确信x-y不会溢出(-2^15<=z<=2^15-1),可以直接写为z=x-y.1.结果超过16位表示范围设x的Q值为Qx,y的Q值为Qy,且Qx>Qy,加
8、法结果z的
此文档下载收益归作者所有