ARM体系中存储系统非对齐的存储访问操作（1）

论坛元老

Rank: 8 Rank: 8

UID: 1029342
性别: 男

1^#

打印

字体大小: tT

yuyang911220发表于 2014-6-20 07:53 | 只看该作者

ARM体系中存储系统非对齐的存储访问操作（1）

Natural

ARM 系列处理器是 RISC （Reducded Instruction Set Computing）处理器。很多基于ARM的高效代码的程序设计策略都源于RISC 处理器。和很多 RISC 处理器一样，ARM 系列处理器的内存访问，也要求数据对齐，即存取“字（Word）”数据时要求四字节对齐，地址的bits[1：0]＝＝0b00；存取“半字（Halfwords）”时要求两字节对齐，地址的bit[0]＝＝0b0；存取“字节（Byte）”数据时要求该数据按其自然尺寸边界（Natural Size Boundary）定位。
　　ARM 编译程序通常将全局变量对齐到自然尺寸边界上，以便通过使用 LDR和 STR 指令有效地存取这些变量。这种内存访问方式与多数 CISC （Complex Instruction Set Computing）体系结构不同，在CISC体系结构下，指令直接存取未对齐的数据。因而，当需要将代码从CISC 体系结构向 ARM 处理器移植时，内存访问的地址对齐问题必须予以注意。在RISC体系结构下，存取未对齐数据无论在代码尺寸或是程序执行效率上，都将付出非常大的代价。
　　本文将从以下几个方面讨论在ARM体系结构下的程序设计问题。
　　未对齐的数据指针
　　C和C++编程标准规定，指向某一数据类型的指针，必须和该类型的数据地址对齐方式一致，所以ARM 编译器期望程序中的 C 指针指向存储器中字对齐地址，因为这可使编译器生成更高效的代码。
　　比如，如果定义一个指向 int 数据类型的指针，用该指针读取一个字，ARM 编译器将使用LDR 指令来完成此操作。如果读取的地址为四的倍数（即在一个字的边界）即能正确读取。但是，如果该地址不是四的倍数，那么，一条 LDR 指令返回一个循环移位结果，而不是执行真正的未对齐字载入。循环移位结果取决于该地址向对于字的边界的偏移量和系统所使用的端序（Endianness）。例如，如果代码要求从指针指向的地址 0x8006 载入数据，即要载入 0x8006、0x8007、0x8008 和 0x8009 四字节的内容。但是，在 ARM 处理器上，这个存取操作载入了0x8004、0x8005、0x8006 和 0x8007 字节的内容。这就是在未对齐的地址上使用指针存取所得到的循环移位结果。
　　因而，如果想将指针定义到一个指定地址（即该地址为非自然边界对齐），那么在定义该指针时，必须使用 __packed 限定符来定义指针：例如，
　　__packed int *pi; // 指针指向一个非字对其内存地址
　　使用了_packed限定符限定之后，ARM 编译器将产生字节存取命令（LDRB或STRB指令）来存取内存，这样就不必考虑指针对齐问题。所生成的代码是字节存取的一个序列，或者取决于编译选项、跟变量对齐相关的移位和屏蔽。但这会导致系统性能和代码密度的损失。
　　值得注意的是，不能使用 __packed 限定的指针来存取存储器映射的外围寄存器，因为 ARM 编译程序可使用多个存储器存取来获取数据。因而，可能对实际存取地址附近的位置进行存取，而这些附近的位置可能对应于其它外部寄存器。当使用了位字段（Bitfield）时， ARM 程序将访问整个结构体，而非指定字段。

在ARM中,通常希望字单元的地址是字对齐的(地址的低两位为0b00),半字单元的地址是半字对齐的(地址的最低为0b0).在存储访问操作中,如果存储单元的地址没有遵守上述的对齐规则,则称为非对齐(unaligned)的存储访问操作.
   转载自：ARM开发板|嵌入式开发http://armdmc.woku.com/article/5018028.html

———————————————— END ————————————————

1.非对齐指令的预取操作当处理器处于ARM状态器件,如果写入到寄存器PC中的值是非字对齐的(低两位不为0b00),要么指令执行的结果不可预知,要么地址值中最低两位被忽略;当处理器处于Thumb状态器件,如果写入到寄存器PC中的值是非半字对齐的(最低位不为0b0),要么指令执行的结果不可预知,要么的重地值中最低位被忽略.如果系统中指定,当发生非对齐的指令预取操作时,忽略地址值中相应的位,则有存储系统实现这种”忽略”.也就是说,这时该地址值原封不动的送到存储系统.2.非对齐的数据访问操作对于Load/Store操作,如果是非对齐的数据访问操作,系统定义了下面3种可能的结果.<1>执行的结果不可预知.<2>忽略字单元地址的低两位,即访问地址为(address _and 0xffffffc)的字单元;忽略半字单元地址的最低位的值,即访问地址位(address _and 0xffffffe)的半字单元.<3>忽略字单元地址值种的低两位的值;忽略半字单元地址的最低位的值.有存储体统实现这种”忽略”.也就是说,这时该地址值原封不动的送到存储系统.arm开发板当发生非对齐的数据访问时,到底采用上述3种处理方法种的哪一种,是有各指令指定的.arm指令预取和自修改代码       在ARM中允许指令预取.在CPU执行当前指令的同时,可以从存储器种预取出若干条指令,具体预取多少条指令,不同的ARM实现种有不同的数值.    预取的指令并不一定能得到执行。比如当前指令完成后,如果发生了异常中断,程序将会跳转到异常中断处理程序处执行,当前预取的指令将被抛弃.或者如果执行了跳转指令,则当前预取的指令也将被抛弃.       正如在不同的ARM嵌入式开发实现预取的指令条数可能不同,当发生程序跳转是,不同的ARM实现种采用的跳转预测算法也可能不同.
   自修改代码指的是代码在执行过程种可能修改自身.对于支持指令预取的ARM系统,自修改代码可能带来潜在的问题.当指令被预取后,在该指令被执行前,如果有数据访问指令修改了位于主存种的该指令,这是被预取的指令和主存种对应的指令不同,从而可能使执行的结果发生错误.
转载自：http://blog.vsharing.com/armlyn/A682353.html
字节对齐详解(x86 + ARM)
一.什么是字节对齐,为什么要对齐?
现代计算机中内存空间都是按照byte划分的，从理论上讲似乎对任何类型的变量的访问可以从任何地址开始，但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问，这就需要各种类型数据按照一定的规则在空间上排列，而不是顺序的一个接一个的排放，这就是对齐。
对齐的作用和原因：各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐.其他平台可能没有这种情况，但是最常见的是如果不按照适合其平台要求对数据存放进行对齐，会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始，如果一个int型（假设为32位系统）如果存放在偶地址开始的地方，那么一个读周期就可以读出这32bit，而如果存放在奇地址开始的地方，就需要2个读周期，并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。显然在读取效率上下降很多。
二.字节对齐对程序的影响:
先让我们看几个例子吧(32bit,x86环境,gcc编译器):
设结构体如下定义：
struct A
{
int a;
char b;
short c;
};
struct B
{
char b;
int a;
short c;
};
现在已知32位机器上各种数据类型的长度如下:
char:1(有符号无符号同)
short:2(有符号无符号同)
int:4(有符号无符号同)
long:4(有符号无符号同)
float:4 double:8
那么上面两个结构大小如何呢?
结果是:
sizeof(strcut A)值为8
sizeof(struct B)的值却是12
结构体A中包含了4字节长度的int一个，1字节长度的char一个和2字节长度的short型数据一个,B也一样;按理说A,B大小应该都是7字节。
之所以出现上面的结果是因为编译器要对数据成员在空间上进行对齐。上面是按照编译器的默认设置进行对齐的结果,那么我们是不是可以改变编译器的这种默认对齐设置呢,当然可以.例如:
#pragma pack (2) /*指定按2字节对齐*/
struct C
{
char b;
int a;
short c;
};
#pragma pack () /*取消指定对齐，恢复缺省对齐*/
sizeof(struct C)值是8。
修改对齐值为1：
#pragma pack (1) /*指定按1字节对齐*/
struct D
{
char b;
int a;
short c;
};
#pragma pack () /*取消指定对齐，恢复缺省对齐*/
sizeof(struct D)值为7。
后面我们再讲解#pragma pack()的作用.

收藏分享评分

继承事业，薪火相传

回复引用

订阅 TOP

返回列表