arm程序由于字节对齐引起问题深入分析

arm程序由于字节对齐引起问题深入分析

ID:20821971

大小:34.00 KB

页数:9页

时间:2018-10-16

arm程序由于字节对齐引起问题深入分析_第1页
arm程序由于字节对齐引起问题深入分析_第2页
arm程序由于字节对齐引起问题深入分析_第3页
arm程序由于字节对齐引起问题深入分析_第4页
arm程序由于字节对齐引起问题深入分析_第5页
资源描述:

《arm程序由于字节对齐引起问题深入分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、ARM程序由于字节对齐引起的问题深入分析首先说说,什么叫对齐。如果一个数据是从偶地址开始的连续存储,那么它就是半字对齐,否则就是非半字对齐;半字对齐的特征是bit0=0,其他位为任意值。字对齐的特征是bit1=0,bit0=1,其他位为任意值。如果一个数据是以能被4整除的地址开始的连续存储,那么它就是字对齐,否则就是非字对齐。举例说明四字节对齐:对内存进行操作时,被访问的地址必须为4的倍数。如果分配到的地址的地址不是4的倍数时,CPU实际访问的地址还是按照字对齐的方式来操作。也就是自动屏蔽bit1和bit0.用ADS的ARMCComplier下OptimizationLevel

2、可能引起问题,其中的一个问题就是字节对齐的问题。下面讲讲问题的现象及实质。当时问题的现象是:程序使用一公共变量Buf创建队列,如果ADS编译优化选项采用Minium则软件工作正常;源码不变,如果采用ALL优化,则不正常,数据紊乱且无法工作。为了发现问题,我们分别用Minium和ALL编译,在反汇编条件下单步跟踪程序,观察CPU寄存器和内存变量的变化情况。发现在Minium模式下,编译器把队列内存块Uart0TxBuf分配到的地址是0x400015cc,这个地址是一个4字节对齐的地址,而在ALL模式下,编译器把Buf分配的地址是0x400015c2,这个地址是一个非4字节对齐的地

3、址。正是由于这个非4字节对齐的地址导致了问题的发生。问题发生在QueueCreate(void*Buf,uint32SizeOfBuf,uint8(*ReadEmpty)(),uint8(*WriteFull)())这个函数里,问题是如何发生的,在了解问题发生的机理前,先了解QueueCreate这个函数的工作原理。QueueCreate工作原理是,首先把buf指向的内存初始化为DataQueue格式的结构体。DataQueue的结构体格式如下:typedefstruct{QUEUE_DATA_TYPE*Out;/*指向数据输出位置*/QUEUE_DATA_TYPE*In;/*

4、指向数据输入位置*/QUEUE_DATA_TYPE*End;/*指向Buf的结束位置*/uint16NData;/*队列中数据个数*/uint16MaxData;/*队列中允许存储的数据个数*/uint8(*ReadEmpty)();/*读空处理函数*/uint8(*WriteFull)();/*写满处理函数*/QUEUE_DATA_TYPE*Buf;/*存储数据的空间*/}DataQueue;从结构体可以看出,结构体字节类型在内存分配为:4字节指针变量(*Out)、4字节指针变量(*In)、4字节指针变量(*End)、2字节变量NData、2字节变量MaxData、4字节函数

5、指针变量ReadEmpty()、4字节函数指针变量(WriteFull())观察结构体起始地址放在非对齐时会出现什么情况。起始地址为0x400015c2时的由编译器分配得到的地址实际操作地址*Out0x400015c2~0x400015c50x40015c0~0x400015c3*In0x400014c6~0x400015c9x400014c4~0x400015c7*End0x400015ca~0x400015cd0x400015c8~0x400015cb从表中可以看出,实际操作的地址按照4字节对齐格式得到。例如,当执行*Out进行操作时,自动屏蔽bit1和bit0,因此实际发

6、生变化的是0x40015c0~0x400015c3,而不是0x400015c2~0x400015c5,由于实际操作地址和编译器分配地址互相覆盖,当对*In操作时,会导致*Out一起变化,对*End操作时,*In也跟着变化。正是由于非对齐的原因导致创建队列和对列操作完全错误。当内存起始地址为4字节对齐地址的情况时,编译器分配地址和实际地址一致,因此不存在上述问题。结论:在ARM嵌入式系统中,当把一个内存区域初始化为某个结构体时,必须注意字节对齐的情况。如果该内存起始地址为非对齐地址,不仅得不到预期的结果,还可能导致一些很奇怪的让人无法理解表面问题。在C层面上不太容易观察到这些问题

7、的实质,只有深入到汇编一层去分析程序,才可能理解这些现象的深层原因。前言ARM流行已久,做嵌入式开发的不知道ARM不大可能。鉴于其所具备的较低功耗下的较高性能,也就成了大多数嵌入式设备的首选不过对于刚上手的人来说,有可能会遇到一些稀奇古怪的问题。毕竟大部分人都习惯了IA-32下的程序设计,虽然两者都是32位的构完全不同,于是也导致了一些隐含的问题。这里想描述一下一个有点蛊惑的问题,即在ARM上访问非对齐地址内容,会出现所问题。ARM内存访问的对齐问题按照ARM文档上的描述,其访问规则如下:1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。