本教程视频已同步到B站: 程序员的C——实用编程,不玩虚的!
高级语法
内存管理
C语言程序加载到内存中,通常可人为划分为栈(stack)、堆(heap)、代码段(text)、数据段(data)、bss 段、常量存储区等区域部分,在这个基础上,人们习惯在逻辑上将C语言程序的内存模型归纳为四大区域。请注意,这四大区域只是逻辑上的划分,实际上对于内存而言,它只是一片连续的存储单元,并不存在什么物理上的区域划分。我们了解C语言内存四区,可以加深对C语言的理解,特别是C语言的内存管理的理解。
内存四区
通常可以将C语言内存布局概括为四个区域,实际上还可以具体细分,详见《内存模型》 章节
-
栈(stack)
-
堆(heap)
-
静态全局区
-
代码区
内存分配
C语言内存分配的三种形式
- 静态/全局内存
静态声明的变量和全局变量都使用这部分内存。在程序开始运行时分配,终止时消失。区别:所有函数都能访问全局变量,静态变量作用域则只局限于定义它的函数内部
- 自动内存
在函数内声明,函数调用时创建(分配在栈中),作用域局限于该函数内部,函数执行完则释放。
- 动态内存
内存分配在堆上,用完需手动释放,使用指针来引用分配的内存,作用域局限于引用内存的指针
为什么需要在堆上面分配动态内存?
在前面的章节中,我们一直使用自动内存,也就是栈内存,这并不影响C程序的编写,那么我们为什么还要去使用动态内存,而且还要很麻烦的去手动管理动态内存呢?
-
栈区的内存大小通常都比较小,具体大小视编译器不同而有所区别,通常可能会在2M大小左右。当我们在处理大文件、图片、视频等数据时,2M显然是不够用的,我们可能需要更大块的内存空间。通常的,堆内存空间大小是没有限制的,只要你电脑的内存条足够大,你就可以向操作系统申请足够大的堆内存空间使用。
-
栈内存的使用有一定特殊性。通常当函数调用结束后就会退栈,那么函数中的局部变量也就不复存在了。当我们需要一个变量或数组有更长的生命周期时,堆内存是更好的选择。
-
全局变量虽然有与程序相同的生命周期,但无法动态的确定大小。例如将数组声明为全局数组变量,那么就必须在声明时静态指定数组的长度。假如我们用一个数组来存放会员注册信息,那么我们根本不能在编译时确定数组的具体长度,显然的,我们需要一个可以动态增长的内存区域。不断有新会员注册,那么我们的数组长度也需要增长。
动态内存管理
在C语言内存分配的三种形式中,真正能由程序员来控制管理的只有在堆上面分配的动态内存,这也是我们需要关注的重点内容。
先看一个示例:
// 定义一个函数,返回局部变量的地址
int *fn(){
int i = 10;
return &i;
}
int main(){
// 对fn函数返回的指针进行解引用
printf("%d",*fn());
return 0;
}
以上示例会报错退出,显然的,我们是不能返回一个局部变量的地址的,局部变量在函数调用结束会就会释放,因此在局部变量作用域之外去操作它的地址是非法操作。
使用动态内存
#include <stdio.h>
#include <stdlib.h>
int *fn(){
// 使用malloc函数,分配动态内存空间,注意包含stdlib.h
int *p = (int*)malloc(sizeof(int));
*p = 16;
return p;
}
int main(){
printf("%d",*fn());
return 0;
}
运行正常,打印结果:
16
申请动态内存之后,如果不手动释放,它就会一直存在,直到程序退出。
可以看到malloc
的函数原型 void *malloc(size_t _Size);
它返回一个void *
类型指针,这是一个无类型或者说是通用类型指针,它可以指向任意类型,因此我们在使用它的返回值时,首先做了强制类型转换。该函数只有一个无符号整数参数,用来传入我们想要申请的内存大小,单位是字节。上例中我们传入的是一个int
类型的大小,通常是4字节。需要特别注意,当使用malloc
分配动态内存时,如果失败,它会返回NULL
指针,因此使用时需判断。
在使用动态内存时,一定要在用完后记得手动释放内存,否则易造成内存泄露
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
char *String(int len){
char *s = (char*)malloc(len);
return s;
}
int main(){
char *str = String(100);
if (str == NULL){
// 内存分配失败时,返回NULL指针,使用时需先判断分配是否成功
printf("Not enough memory space!\n");
}
strncpy(str,"Hi,use dynamic memory space",100);
printf("%s\n",str);
// 手动释放内存
free(str);
return 0;
}
与动态内存管理相关的主要有四个函数
函数 | 功能 |
---|---|
malloc | 从堆上分配一块指定大小的内存,并返回分配的空间的起始地址,这里是一个void类型指针,如果系统内存不足以分配,则返回NULL。该函数不会清空所分配的内存空间中的内容,因此可能分配的空间会包含一些随机数据 |
calloc | 该函数的功能基本与malloc 相同,主要的区别是,它分配堆内存时会进行清空,因此内存空间不会包含一些随机数据,当然,相应的,它的性能也略低于malloc ,毕竟它多做了一个清理内存的工作。 |
realloc | 该函数用于重新分配内存大小,其使用情况,较以上两个函数要复杂。 该函数也不会对申请的内存空间进行任何初始化。 |
free | 该函数用于手动释放以上三个函数所申请的堆内存空间。它的参数是一个指向所分配的动态内存的指针。要注意,该函数只能用来释放以上三个函数申请的堆空间,它们需成对使用,不能用来释放任意内存空间。 |
calloc
原型
void *calloc(size_t _NumOfElements,size_t _SizeOfElements);
第一个参数用来指定元素的个数,第二个参数指定一个元素所占内存大小。malloc
函数的参数正好相当于它的两参数的乘积。
int *array = (int*)calloc(10,sizeof(int));
realloc
原型
void *realloc(void *_Memory,size_t _NewSize);
它的第一个参数为指向原内存块的指针,第二个参数为重新请求的内存大小。
当我们使用malloc
动态分配了一块内存空间,随着数据的增加,内存不够用时,就可以使用realloc
调整原来分配的内存大小。
int main(){
// 分配10个元素大小的int数组
int *arr = (int*)malloc(10*sizeof(int));
if (arr == NULL){
printf("malloc:Not enough memory space!\n");
return -1;
}
// 将原数组扩展到20个元素大小
int *newArr = (int*)realloc(arr, 20*sizeof(int));
if(newArr == NULL){
printf("realloc:Not enough memory space!\n");
}else{
arr = newArr;
}
// do sometings
// 释放内存
free(arr);
return 0;
}
使用realloc
函数需要注意,当原内存空间之后还有足够的内存可分配时,那么就会紧随原内存空间之后扩展空间,这样一来,realloc
返回的void指针与指向原内存空间的指针相同;如果原内存空间之后没有足够的内存可扩展了,那么就在堆内存中其他的拥有足够空间的地方重新分配空间,并将原内存空间中的数据复制到新空间,只是这样一来,其他地方保存的原内存空间的地址就必须修改为realloc
返回的新地址,且原内存空间会被释放,旧地址不可用。可以看到,该函数之所以如此复杂,其目的就是为了保证申请的空间都是一片连续的内存空间,而不是碎片化的内存。
关于realloc
的使用总结
第一个参数 | 第二个参数 | 描述 |
---|---|---|
NULL | 欲申请空间大小 | 功能等同malloc ,申请新的堆空间 |
非NULL | 0 | 等同于free ,释放原内存空间 |
非NULL | 比原内存空间小 | 在原内存空间基础上回收部分内存,相当于缩小空间 |
非 NULL | 比原内存空间大 | 在原内存空间之后扩展,或者在其他位置重新分配更大空间 |
-
realloc
函数功能强大,可以用来申请新的堆空间,释放堆空间,调整原来的堆空间。它一个就能替代其他的三个函数 -
realloc
函数如果返回NULL
,则表明内存不足,申请新的堆空间或者将原空间调大失败。失败时,它不会对原来的堆空间造成影响
关于free
的使用总结
当使用free
函数释放内存后,指向原堆空间的指针并不会被清理或重置,这意味着指向原空间的指针中仍保存着一个不合法的地址,如果不小心再次使用了这个指针,就会造成无法预知的问题,因此在使用free
释放内存后,还应当将原指针重置为NULL
arr = (int*)realloc(arr, 20*sizeof(int));
// 释放内存
free(arr);
// arr指针保存的地址已经不合法,需重置
arr = NULL;
指针高级
二维数组
如果数组中的元素也是数组,那么这样的数组就是二维数组,在逻辑上,仿佛有两个维度,实际上在内存中仍然是一片线性的连续的内存空间。
#include <stdio.h>
int main(){
// 声明并初始化一个二维数组
// 第一个[5]表示外层数组的元素个数
// 第二个[3]表示作为外层数组元素的内层数组的元素个数
int table[5][3]={
{11,12,13},
{21,22,23},
{31,32,33},
{41,42,43},
{51,52,53}
};
printf("%x\n",table);
printf("%x\n",&table[0][0]);
printf("%x\n",&table[0][1]);
printf("%x\n",&table[0][2]);
printf("%x\n",&table[1][0]);
return 0;
}
调试
再来看元素内存地址的打印结果
22fe10
22fe10
22fe14
22fe18
22fe1c
可以发现二维数组很像一个二维表格,有行有列,但是从元素的内存地址可以看出,在内存中仍然是连续的一片。
关于二维数组的遍历
// 二维数组遍历
for (int i = 0; i < 5; i++){
for (int j = 0; j < 3; j++){
printf("%d\n",table[i][j]);
}
}
二维数组的本质:
二维数组在逻辑上是二维的,有行和列,但由于内存的特点,二维数组元素在内存中仍然是线性排列的。
例如数组int a[3][4] = { {0, 1, 2, 3}, {4, 5, 6, 7}, {8, 9, 10, 11} }
,我们想象中是这样:
但在内存中,实际分布是这样
因此,C语言中可以把一个二维数组分解成多个一维数组来处理。对于数组 a,它可以分解成三个一维数组,即 a[0]、a[1]、a[2]。每一个一维数组又包含了 4 个元素。
假设数组 a 中第 0 个元素的地址为 1000,那么每个一维数组的首地址如下图:
思考题
以下程序的输出是什么?
#include <stdio.h>
int main(void) {
int i = 10;
int x = (i++, ++i);
printf( "x = %d\n", x);
return 0;
}
下面程序输出了什么,解释其语法:
#include <stdio.h>
int main(void){
int a[3][2] = {(0, 1), (2, 3), (4, 5)};
printf("%d\n", a[0]);
printf("%d\n", a[0][0]);
return 0;
}
二级指针
所谓二级指针,就是一个指向指针的指针。
我们知道指针变量是用来保存一个普通变量的地址的,那么如果对一个指针变量取地址,并用另一个变量保存指针变量的地址,这种情况是否存在呢?
int main(){
int num = 16;
// 声明一个一级指针
int *p = #
// 声明一个二级指针,一个指向指针的指针
int **pp = &p;
printf("p=%x\n",p);
printf("pp=%x\n",pp);
printf("&pp=%x\n",&pp);
return 0;
}
打印结果:
p=22fe4c
pp=22fe40
&pp=22fe38
可以看到,凡是变量都有地址,即使是指针变量也是有地址的,这种使用两个*
来声明的指向指针的变量,就是二级指针。一级指针存的是普通变量的内存地址,二级指针则是存的一个一级指针的内存地址。
在遇到二级指针时,要获取原始变量的值,就需要使用两个*
进行解引用,如上例中的**p
可获取num
的值,如使用一个*
解引用,获得的只是指针p
的地址而已。
除了二级指针,自然还可以有三级指针、四级指针等等,三级指针极为少用,四级指针及之后面就没有意义了。除了二级指针有较强的实用意义,其他的基本可以忽略。
引出了二级指针,有人一定会问,二级指针到底有什么用处,在哪里使用?下面看一个示例
int main(){
// 使用二维数组保存英文歌单
char songs[10][50]={
"My love",
"Just one last dance",
"As long as you love me",
"Because of you",
"God is a girl",
"Hero",
"Yesterday once more",
"Lonely",
"All rise",
"One love"
};
for (size_t i = 0; i < 10; i++){
printf("%s\n",songs[i]);
}
return 0;
}
在C语言中,字符串是用字符数组来表示的,那么字符串数组也必然是一个二维数组,如上。在字符串的章节中讲过,C语言字符串也可以使用char*
来表示,那么字符串数组也就可以使用二级指针char **
来表示了。
void printStrings(char **s,int len){
char **start = s;
// 使用二级指针来遍历字符串数组
for (;s < start + len;s++){
printf("%s\n",*s);
}
}
int main(){
// 声明一个char*类型的数组,它的元素是一个char*指针
char* songs[10]={
"My love",
"Just one last dance",
"As long as you love me",
"Because of you",
"God is a girl",
"Hero",
"Yesterday once more",
"Lonely",
"All rise",
"One love"
};
// 一个指针数组的数组名,实际上就是一个二级指针
char **p = songs;
printStrings(p,10);
return 0;
}
可以用一句话来解释一级指针和二级指针的使用区别:
一级指针是用来修改所指向的内存空间中的值,二级指针是用来修改一级指针指向的内存空间。
二级指针的实际运用
#include <stdio.h>
#include <string.h>
// 打印字符串数组
void printStr(char **s,int len){
char **start = s;
for (;s < start + len;s++){
printf("%s\n",*s);
}
}
void handleStr(char **buf,int size){
char **tmp = buf;
while (buf < tmp + size){
//遍历字符串数组,如果包含"love",则修改为 520
if(strstr(*buf,"love") != NULL){
*buf = "520";
};
buf++;
}
}
int main(){
// 声明一个字符串数组
char* songs[5]={
"My love",
"As long as you love me",
"Because of you",
"God is a girl",
"Hero",
};
char **p = songs;
handleStr(p,5);
printStr(p,5);
return 0;
}
打印结果
520
520
Because of you
God is a girl
Hero
拓展
数组类型
//定义一个数组类型
typedef int(MyArray)[10];
MyArray myArray;
myArray[0] = 8;
printf("%d \n", myArray[0]);
指针数组
如果一个数组中的所有元素保存的都是指针,那么我们就称它为指针数组。指针数组的定义形式为:
dataType *(arrayName[length]);
又由于[]
运算符的优先级高于*
,因此圆括号可以省略,其简写形式为:
dataType *arrayName[length];
例如:int *arr[3];
数组指针
如果一个指针指向了数组,我们就称它为数组指针(Array Pointer)。数组指针也称指向一维数组的指针,亦称行指针。其定义形式为:
dataType *(arrayName)[length];
由于[]
运算符的优先级高于*
,因此圆括号是不能省略的。例如int(*p)[4];
,它表示定义了一个指针变量p
,指向大小为4个整型的数组,p指针每次移动的步长为4个整型(即sizeof(int) * 4
)
int a[10];
typedef int (*PTypeArray)[10];
PTypeArray myPArray;
myPArray = &a;
(*myPArray)[0] = 20;
printf("a[0]= %d\n", a[0]);
如上例,其实数组指针相当于一个普通的二维指针。
指针数组和数组指针的区别
这两个概念很容易混淆,其实画图是最好的理解方式:
int *p1[10];
int (*p2)[10];
函数指针
在上面的内存四区中提到了代码区,而函数就是一系列指令的集合,因此它也是存放在代码区。既然存放在内存中,那么就会有地址。我们知道数组变量实际上也是一个指针,指向数组的起始地址,结构体指针也是指向第一个成员变量的起始地址,而函数指针亦是指向函数的起始地址。
所谓函数指针,就是一个保存了函数的起始地址的指针变量。
函数指针的声明
声明格式:
【返回值类型】 (*变量名) (【参数类型】)
实例
// 分别声明四个函数指针变量 f1、f2、f3、f4
int (*f1)(double);
void (*f2)(char*);
double* (*f3)(int,int);
int (*f4)();
函数指针的赋值与使用
当一个函数的原型与所声明的函数指针类型匹配,那么就可以将一个函数名赋值给函数指针变量。
int count(double val){
printf("count run\n");
return 0;
}
void printStr(char *str){
printf("printStr run\n");
}
double *add(int a,int b){
printf("add run\n");
return NULL;
}
int get(){
printf("get run\n");
return 0;
}
int main(){
// 声明函数指针并初始化为NULL
int (*f1)(double) = NULL;
void (*f2)(char*) = NULL;
double* (*f3)(int,int) = NULL;
int (*f4)() = NULL;
// 为函数指针赋值
f1 = &count;
f2 = &printStr;
f3 = &add;
f4 = &get;
// 使用函数指针调用函数
f1(0.5);
f2("f2");
f3(1, 3);
f4();
return 0;
}
函数名同数组名一样,它本身就是一个指针,因此可以省略取地址的操作,直接将函数名赋值给指针
f1 = count;
f2 = printStr;
f3 = add;
f4 = get;
函数指针的传递
// 加法函数
int add(int a,int b){
return a +b;
}
// 减法函数
int sub(int a, int b){
return a-b;
}
// 计算器函数。将函数指针做形式参数
void calculate(int a,int b, int(*proc)(int,int)){
printf("result=%d\n",proc(a,b));
}
int main(){
// 算加法,传入加法函数
calculate(10,5,add);
// 算减法,传入减法函数
calculate(10,5,sub);
return 0;
}
可以看到,将函数指针作为参数传递,可以使得C语言编程变得更加灵活强大。而在Python、JavaScript等编程语言中,当前流行的函数式编程范式,即将一个函数作为参数传入到另一函数中执行,实际上有些古老的C语言中早就能实现了。
除此之外,C语言还有其他的一些奇技淫巧,虽然看起来实现得不够优雅,但也足以证明C语言无所不能。
以上在函数的形参中直接定义函数指针看起来不够简洁优雅,每次都得写一大串,实际上还有更简洁的方式,这就需要借助typedef
// 定义一个函数指针类型,无需起新的别名
typedef int(*proc)(int,int);
// 使用函数指针类型 proc 声明新的函数指针变量 p
void calculate(int a,int b, proc p){
printf("result=%d\n",p(a,b));
}
函数指针实用小结
- 利用函数指针可以实现函数式编程
- 将函数指针存入数组中,可以像Java、Python这样,实现函数回调通知机制
- 将结构体与函数指针结合,可以模拟面向对象编程中的类。实际上Go语言就是这样做的,Go语言没用类机制,就是使用结构体模拟面向对象编程。
void*指针
前面几次提到通用类型指针void*
,它可以指向任意类型,但对于void*
指针到底是什么没有做深入的探讨。事实上,只有理解了void*
指针,才能真正理解C语言指针的本质,才能使用void*
指针实现一些奇技淫巧。
首先思考一个问题,指针仅仅是用来保存一个内存地址的,所有的内存地址都只是一个号码,那么指针为什么还需要类型呢?理论上所有的指针都应该是同一种类型才对呀?
先写个代码探索一番
int main(){
short num = 18;
char *pChar = (char*)#
int *pInt = (int*)#
printf("pChar=%x pInt=%x\n",pChar,pInt);
printf("*pChar=%d *pInt=%d\n",*pChar,*pInt);
return 0;
}
分别强制使用char*
指针和int*
指针来保存short num
的地址,打印结果如下:
pChar=22fe3e ---- pInt=22fe3e
*pChar=18 ---- *pInt=-29491182
可以看到,保存地址是OK的,但是解引用获取值就会存在问题。由此我们基本可以推断一个事实,指针用来保存变量的内存地址与变量的类型无关,任何类型指针都可以保存任何一个地址;指针之所以需要类型,只与该指针的解引用有关。
short
是2个字节,char
是1个字节,int
是4个字节,而指针保存的是第一个字节的地址,当指针声明为short
时,编译器就知道从当前这个地址往后取几个字节作为一个整体。如果指针没有具体类型,那么编译器根本无法判断应从当前这个字节往后取几个字节。如上例,*pInt
解引用后结果错误,这就是因为原类型是short
2字节,而使用int*
指针去解引用会超出short
本身的两字节内存,将紧随其后的两字节内存也强制读取了,访问了不合法的内存空间,这实际上是内存越界造成的错误值。
当我们不确定指针所指向的具体数据类型时,就可以使用void*
类型来声明,当我们后续确定了具体类型之后,就可以使用强制类型转换来将void*
类型转换为我们需要的具体类型。
接触过Java等具有泛型的面向对象编程语言的人,可能马上就会联想到泛型,是的,C语言没有泛型,但是利用void*
指针的特点,我们可以使用一些技巧来模拟泛型编程。
再看一个示例
// 交换两个变量的值
void swap(int *a,int *b){
int tmp =*a;
*a = *b;
*b = tmp;
}
int main(){
int n = 6, l=8;
swap(&n, &l);
printf("n=%d l=%d\n",n,l);
return 0;
}
以上swap
函数是交换两个int
类型变量的值,如果需要交换char
、short
或double
类型呢?岂不是每一种类型都需要写一个函数吗?像Java这样的编程语言存在泛型,我们可以定义泛型,而不需要在函数声明时指定具体类型,当调用的时候传入的是什么类型,函数就计算什么类型,我们看一下C语言如何实现
// 交换两个变量的值
void swap(void* a, void *b, int size){
// 申请一块指定大小的内存空间做临时中转
void *p = (void*)malloc(size);
// 内存拷贝函数,拷贝指定的字节数
memcpy(p, a, size);
memcpy(a, b, size);
memcpy(b, p, size);
// 释放申请的内存空间
free(p);
}
int main(){
int n = 6, l=8;
// 传入int型指针
swap(&n, &l,sizeof(int));
printf("n=%d l=%d\n",n,l);
// 传入short型指针
short x=10,y=80;
swap(&x, &y,sizeof(short));
printf("x=%d y=%d\n",x,y);
return 0;
}
打印结果:
n=8 l=6
x=80 y=10
思考题
彻底学完了指针相关的东西,这里有几道思考题,测测自己能否全部答对。
-
说出下面表达式的含义?
int *p1[10]; int (*p2)[10];
-
根据以下代码,分别说出
*p++
、(*p)++
、*++p
、++*p
的值int a[5] = {1, 2, 3, 4, 5}; int *p = a;
-
给定声明
const char * const *pp;
下列哪个操作是正确的?(A)pp++ (B)(*pp)++ (C)(**pp)='c'; (D)以上都不对
-
下面代码实现两数交换,是否正确,为什么?
void swap(int* a, int* b) { int *p; p = a; a = b; b = p; }
-
根据以下代码计算
sizeof
的值char str1[] = {'a', 'b', 'c', 'd', 'e'}; char str2[] = "abcde"; char *ptr = "abcde"; char book[][80]={"编程之路","从0到1","C程序设计的艺术","C数据结构"}; // sizeof(str1)= ? // sizeof(str2)= ? // sizeof(ptr)= ? // sizeof(book)= ? // sizeof(book[0])= ?
-
判断以下代码的输出值?
char str1[] = "abc"; char str2[] = "abc"; const char str3[] = "abc"; const char str4[] = "abc"; const char *str5 = "abc"; const char *str6 = "abc"; char *str7 = "abc"; char *str8 = "abc"; printf("%d\n",str1 == str2); printf("%d\n",str3 == str4); printf("%d\n",str5 == str6); printf("%d\n",str7 == str8);
-
下面程序有错误吗?若有如何修改?
#include <stdio.h> char *test(){ char p[] = "hello world!"; return p; } int main(){ char *str = NULL; str = test(); printf("%s\n", str); return 0; }
-
以下程序的输出结果是什么?
# include <stdio.h> int main( void){ int a[5] = {1,2,3,4,5}; int *ptr= (int *)(&a+1); printf("%d,%d",*(a+1),*(ptr-1)); return 0; }
# include <stdio.h> int main(){ int arr[] = {1,2,3,4,5,6,7,8}; int *p = arr; *(p++) += 123; printf("%d,%d ", *p,*(++p)); return 0; }
#include <stdio.h> int main(void){ char *str[] = {"ab","cd","ef","gh","ij","kl"}; char *t; t = (str+4)[-1]; printf("%s\n",t); return 0 ; }
关注公众号:编程之路从0到1