简介本文简单谈谈C++开发中的字节对齐,感兴趣的朋友可以参考一下。
现代计算机中内存空间都是按照字节(byte)划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定的内存地址访问,这就需要各类型数据按照一定的规则在空间上排列,而不是顺序地一个接一个地排放,这就是对齐。
各个硬件平台对存储空间的处理上有很大的不同 。一些平台对某些特定类型的数据只能从某些特定地址开始存取,其他平台可能没有这种情况。但是最常见的是,如果不按照适合其平台的要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,一个int型(假设为 32位)如果存放在偶地址开始的地方,那么一个读周期就可以读出,而如果存放在奇地址开始的地方,就可能会需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该int数据,显然在读取效率上下降很多。这也是空间和时间的博弈。
在网络程序中,掌握这个概念可是很重要的:如果 在不同平台之间(比如在Windows 和Linux之间)传递2进制流(比如结构体) ,那么在这两个平台间必须要定义相同的对齐方式,不然莫名其妙地出了一些错,可是很难排查的。
通常,我们写程序的时候,不需要考虑对齐问题,编译器会替我们选择适合目标平台的对齐策略。当然,我们也可以通知给编译器传递预编译指令而改变对指定数据的对齐方法,比如写入预编译指令#pragma pack(2),即告诉编译器按两字节对齐。
但是,正因为我们一般不需要关心这个问题,所以,如果编辑器对数据存放做了对齐,而我们不了解的话,常常会对一些问题感到迷惑。最常见的就是struct数据结构的sizeof结果,比如以下程序:
#include<stdio.h>
int main(void)
{
struct A
{
char a;
short b;
int c;
};
printf("结构体类型A在内存中所占内存为:%d字节。\n", sizeof(struct A));
return 0;
}
输出结果为:8字节。
如果我们将结构体中的变量声明位置稍加改动(并不改变变量本身),请再看以下程序:
#include<stdio.h>
int main(void)
{
struct A
{
short b;
int c;
char a;
};
printf("结构体类型A在内存中所占内存为:%d字节。\n", sizeof(struct A));
return 0;
}
输出结果为:12字节。
问题出来了,他们都是同一个结构体,为什么占用的内存大小不同呢?为此,我们需要对对齐算法有所了解。
由于各个平台和编译器的不同,现以32位,vc++6.0系统为例,来讨论编译器对struct数据结构中的各成员如何进行对齐的。
首先,我们给出四个概念:
设结构体如下定义:
struct A
{
char a;
short b;
int c;
};
a是char型数据,占用1字节内存;short型数据,占用2字节内存;int型数据,占用4字节内存。因此,结构体A的自身对齐值为4。于是, a和b要组成4个字节,以便与c的4个字节对齐 。而a只有1个字节,a与b之间便空了一个字节。我们知道, 结构体类型数据是按顺序存储结构一个接一个向后排列的 ,于是其存储方式为:
其中空白方格无数据,是浪费的内存空间,共占用8字节内存。
实际上,为了更加明显地表示“对齐”,我们可以将以上结构想象为以下的行排列:
对于另一个结构体定义:
struct A
{
short b;
int c;
char a;
};
其内存存储方式为:
同样把它想象成行排列:
可见,浪费的空间更多。
其实,除了结构体之外,整个程序在给每个变量进行内存分配时都会遵循对齐机制,也都会产生内存空间的浪费。但我们要知道,这种浪费是值得的,因为它换来的是效率的提高。
以上分析都是建立在程序默认的对齐值基础之上的,我们可以通过添加预定义命令#pragma pack(value)来对对齐值进行自定义,比如#pragma pack(1),对齐值变为1, 此时内存紧凑,不会出现内存浪费,但效率降低了 。效率之所以降低,是因为: 如果存在更大字节数的变量时(比1大),比如int类型,需要进行多次读周期才能将一个int数据拼凑起来。
补充练习:
#include <iostream>
struct A
{
char i;
int j;
char k;
};
struct B
{
char i;
double j;
char k;
};
struct C
{
double j;
char i;
char k;
};
int main(int argc, char* argv[])
{
std::cout << sizeof(A) << " " << sizeof(B) << " " << sizeof(C) << std::endl;
return 0;
}
结果是:12 24 16
#include <iostream>
#pragma pack(push) // 默认对齐
#pragma pack(1) // 1字节对齐 结果:6 10 10
struct A
{
char i;
int j;
char k;
};
#pragma pack(8) // 8字节对齐 结果:6 24 16
struct B
{
char i;
double j;
char k;
};
#pragma pack(4) // 4字节对齐 结果:6 24 12
struct C
{
double j;
char i;
char k;
};
#pragma pack(pop) // 默认对齐
int main(int argc, char* argv[])
{
std::cout << sizeof(A) << " " << sizeof(B) << " " << sizeof(C) << std::endl;
return 0;
}
本文向大家介绍一个C++实战项目:C++实现雪花算法(SnowFlake)产生唯一ID,主要涉及雪花算法、算法知识等,具有一定的C++实战价值,感兴趣的朋友可以参考一下。
本文介绍一个C++代码片段:如何在C++中删除一个文件目录下的所有文件及目录,感兴趣的朋友可以参考一下。
本文介绍C++实现C++实现8种排序算法,主要包括冒泡排序、插入排序、二分插入排序、希尔排序、直接选择排序、堆排序、归并排序、快速排序,直接上代码,感兴趣的朋友可以参考一下。
本文介绍C++实现线程同步的四种方式:事件对象、互斥对象、临界区、信号量,感兴趣的朋友可以参考一下。
本文介绍C++内存泄漏的检测与定位方法,感兴趣的朋友可以参考一下。
本文向大家介绍一个C++实战项目:C++实现一个多线程安全的队列容器模板类,主要涉及C++模板类的使用、互斥体实现多线程安全、队列数据结构等知识,具有一定的C++实战价值,感兴趣的朋友可以参考一下。