动态内存分配
在C中动态分配内存的基本步骤有:
- 用malloc类的函数分配内存;
- 用这些内存支持应用程序;
- 用free函数释放内存。
int *pi = (int*) malloc(sizeof(int));
*pi = 5;
printf("pi:%d\n",*pi);
free(pi);
考虑如下代码段,我们为字符串分配内存,让它可以存放最多5个字符外加结尾的NUL字符。for循环在每个位置写入0,但是没有在写人6字节后停止。for语句的结束条件是写入8字节。写入的0是二进制О而不是ASCII字符0的值。
char *pc = (char*) malloc(6);
for(int i = 0; i < 8; i++){
*pc[i] = 0;
}
在本例中,6字节的字符串后面还分配了额外的内存,这是堆管理器用来记录内存分配的。如果我们越过字符串的结尾边界写入,额外的内存中的数据会损坏。
内存泄漏
导致内存泄漏的情况可能如下:
- 丢失内存地址;
- 应该调用free函数却没有调用(有时候也称为隐式泄漏)。
丢失地址
当pi被赋值为一个新地址时丢失内存地址的例子:
int *pi = (int*) malloc(sizeof(int));
*pi = 5;
...
pi = (int*) malloc(sizeof(int));
为字符串分配内存,将其初始化,并逐个字符打印字符串分配内存的起始地址丢失了:
char *name = (char*) malloc(strlen("Susan")+1);
strcpy(name,"Susan");
while(*name != 0){
printf("%c",*name);
name++;
}
隐式内存泄漏
如果程序应该释放内存而实际却没有释放,也会发生内存泄漏。如果我们不再需要某个对象但它仍然保存在堆上,就会发生隐式内存泄漏,一般这是程序员忽视所致。
在释放用struct关键字创建的结构体时也可能发生内存泄漏。如果结构体包含指向动态内存的指针,那么可能需要在释放结构体之前先释放这些指针。
动态内存分配函数
动态内存分配函数:
- malloc
- realloc
- calloc
- free
函数 | 描述 |
---|---|
malloc | 从堆上分配内存 |
realloc | 在之前分配的内存块的基础上,将内存重新分配为更大或者更小的部分 |
calloc | 从堆上分配内存并清零 |
free | 将内存块返回堆 |
使用malloc函数
传递参数给这个函数时要小心,因为如果参数是负数就会引发问题:
void* malloc(size_t);
malloc函数经典用法:
int *pi = (int*) malloc(sizeof(int));
执行malloc函数时会进行以下操作:
- 从堆上分配内存;
- 内存不会被修改或是清空;
- 返回首字节的地址。
因为当malloc无法分配内存时会返回NULL,在使用它返回的指针之前先检查NULL是不错的做法,如下所示:
int *pi = (int*) malloc(sizeof(int));
if(pi != NULL){
// 指针没有问题
}else{
// 无效的指针
}
要不要强制类型转换:C引入void指针后,可将void指针赋值给其他任何指针类型,所以就不再需要显式类型转换了。但有些开发者认为显式类型转换是不错的做法。
初始化静态或全局变量时不能调用malloc函数。
static int *pi = malloc(sizeof(int)); //出错,全局变量也一样
对于静态变量,可以通过在后面用一个单独的语句给变量分配内存来避免这个问题。但是全局变量不能用单独的赋值语句,因为全局变量是在函数和可执行代码外部声明的,赋值语句这类代码必须出现在函数中:
sttaic int *pi;
pi = malloc(sizeof(int));
使用calloc函数
void *calloc(size_t numElements, size_t elementSize);
calloc函数会根据numElements和elementSize两个参数的乘积来分配内存,并返回一个指向内存的第一个字节的指针。如果不能分配内存,则会返回 NULL。此函数最初用来辅助分配数组内存。
int *pi = calloc(5,sizeof(int));
等价于:
int *pi = malloc(5 * sizeof(int));
memset(pi, 0, 5 * sizeof(int));
如果内存需要清零可以使用calloc,不过执行calloc可能比执行malloc慢。
使用realloc函数
void *realloc(void *ptr,size_t size);
realloc函数的行为
第一个参数 | 第二个参数 | 行为 |
---|---|---|
空 | 无 | 同malloc |
非空 | 0 | 原内存块被释放 |
非空 | 比原内存块小 | 利用当前的块分配更小的块 |
非空 | 比原内存块大 | 要么在当前位置要么在其他位置分配更大的块 |
alloca函数和变长数组
alloca函数(微软为malloca)在函数的栈帧上
分配内存。函数返回后会自动释放内存。若底层的运行时系统不基于栈,alloca函数会很难实现,所以这个函数是不标准的,如果应用程序需要可移植就尽量避免使用它。
C99引入了变长数组(VLA),允许函数内部声明和创建其长度由变量决定的数组。在下例中,我们分配了一个在函数内使用的char数组:
void compute(int size){
char* buffer[size];
...
}
这意味着内存分配在运行时完成,且将内存作为栈帧的一部分来分配。另外,如果数组用到sizeof操作符,也是在运行时而不是编译时执行。
用free函数释放内存
void free(void *ptr);
指针参数应该指向由malloc类函数分配的内存的地址,这块内存会被返还给堆。尽管指针仍然指向这块区域,但是我们应该将它看成指向垃圾数据。稍后可能重新分配这块区域,并将其装进不同的数据。
将已释放的指针赋值为NULL
已释放的指针仍然可能造成问题。如果我们试图解引一个已释放的指针,其行为将是未定义的。所以有些程序员会显式地给指针赋NULL来表示该指针无效,后续再使用这种指针会造成运行时异常。
int *pi = (int*) malloc(sizeof(int));
...
free(pi);
pi = NULL;
重复释放
p1 = (int*) malloc(sizeof(int));
int *p2 = p1;
free(p1);
...
free(p2);
堆和系统内存
堆一般利用操作系统的功能来管理内存。堆的大小可能在程序创建后就固定不变了,也可能可以增长。不过堆管理器不一定会在调用free 函数时将内存返还给操作系统。释放的内存只是可供应用程序后续使用。所以,如果程序先分配内存然后释放,从操作系统的角度看,释放的内存通常不会反映在应用程序的内存使用上。
程序结束前释放内存
确保程序终止前释放所有内存:
- 可能得不偿失;
- 可能很耗时,释放复杂结构也比较麻烦;
- 可能增加应用程序大小;
- 导致更长的运行时间;
- 增加引人更多编程错误的概率。
是否要在程序终止前释放内存取决于具体的应用程序。
迷途指针
迷途指针:如果内存已经释放,而还在引用原始内存的指针。
是用哪个迷途指针会造成一系列问题,包括:
- 如果访问内存,则行为不可预期;
- 如果内存不可访问,则是段错误;
- 潜在的安全隐患。
导致这几类问题的情况可能如下:
- 访问已释放的内存;
- 返回的指针指向的是上次函数调用中的自动变量。
迷途指针示例
简单的案例
int *pi = (int*) malloc(sizeof(int));
*pi = 5;
printf("*pi: %d\n",*pi);
free(pi);
执行free函数将释放地址500处的内存,此后就不应该再使用这块内存了。但大部分运行时系统不会阻止后续的访问或修改。我们还是可以向这个位置写入数据,如下所示。这么做的结果是不可预期的。
free(pi);
*pi = 10;
指针别名的案例
还有一种迷途指针的情况更难觉察:一个以上的指针引用同一内存区域而其中一个指针被释放。
int *p1 = (int*) malloc(sizeof(int));
*p1 = 5;
...
int *p2;
p2 = p1;
...
free(p1);
...
*p2 = 10; // 迷途指针
块语句的问题
int *pi;
...
{
int tmp = 5;
pi = &tmp;
}
// 这里pi变成了迷途指针
foo();
处理迷途指针
对付迷途指针的方法:
- 释放指针后置为NULL,后续使用这个指针会终止应用程序。不过,如果存在多个指针的话还是会有问题。因为赋值只会影响一个指针。
- 写一个特殊的函数代替free函数。
- 有些系统(运行时或调试系统)会在释放后覆写数据(比如OxDEADBEEF,取决于被释放的对象,Visual Studio 会用0xCC、0xCD或者0xDD)。在不抛出异常的情况下,如果程序员在预期之外的地方看到这些值,可以认为程序可能在访问已释放的内存。
- 用第三方工具检测迷途指针和其他问题。
调试器对检测内存泄漏的支持
特殊的内存管理技术:
- 检测堆的完整性;
- 检测内存泄漏
- 模拟对内存不够的情况。
动态内存分配技术
C的垃圾回收
malloc和free函数提供了手动分配和释放内存的方法。不过对于很多问题,需要考虑使用C的手动内存管理,比如性能、达到好的引用局部性、线程问题,以及优雅地清理内存。
有些非标准的技术可以用来解决部分问题,本节将探讨其中一部分技术。这些技术的关键特性在于自动释放内存。内存不再使用之后会被收集起来以备后续使用,释放的内存称为垃圾,因此,垃圾回收就是指这个过程。
鉴于以下原因,垃圾回收是有价值的:
- 不需要程序员费尽心思决定何时释放内存;
- 让程序员专注应用程序本身的问题。
Boehm-Weiser Collector (http://www.hp1.hp.com/personal/Hans_Boehm/gc/)可以作为手动内存管理的替换方法,不过它不属于语言的一部分。
资源获取即初始化
资源获取即初始化(Resource Acquisition Is Initialization,RAII)是Bjarne Stroustrup发明的技术,可以用来解决C++中资源的分配和释放。即使有异常发生,这种技术也能保证资源的初始化和后续的释放。分配的资源最终总是会得到释放。
GNU的扩展要用到RAII_VARIABLE宏,它声明一个变量,然后给变量关联如下属性:
- 一个类型;
- 创建变量时执行的函数;
- 变量超过作用域时执行的函数。
#define RAII_VARIABLE(vartype,varname ,initval,dtor) \
void _dtor_ ## varname (vartype * v) { dtor(*v); } \
vartype varname __attribute__((cleanup(_dtor_ ## varname))) = (initval)
在下例中,我们将name变量声明为字符指针。创建它时会执行malloc函数,为其分配32字节。当函数结束时,name超出作用域就会执行free函数:
void raiiExample() {
RAII_VARIABLE(char*, name, (char*)malloc(32), free);
strcpy(name , "RAII Example");
printf("%s\%n" ,name);
函数执行后会打印“RAII_Example"字符串。
使用异常处理函数
另一种处理内存释放的方法是利用异常处理(http://www.adomas.org/excc/)。尽管异常处理不属于标准C,但如果可以使用它且不考虑移植问题,它会很有用。下面说明利用Microsoft Visua Studio版的C语言的方法。
这里的try块包含任何可能在运行时抛出异常的语句。不管有没有异常抛出,都会执行finally块,因此也一定会执行free函数。
void exceptionExample() {
int *pi = NULL;
__try {
pi = (int*)malloc(sizeof(int));
*pi = 5;
printf("%d\n", *pi);
}
__finally{
free(pi);
}
}
小结
动态内存分配技术,malloc和free函数实现手动分配内存。
以及RAII和异常处理技术。