C语言入坑指南-数组之谜

前言

在C语言中,数组和指针似乎总是“暧昧不清”,有时候很容易把它们混淆。本文就来理一理数组和指针之间到底有哪些异同。

数组回顾

在分析之前,我们不妨回顾一下数组的知识。数组是可以存储一个固定大小的相同类型元素的顺序集合。为了便于我们说明,假设有以下数组声明:

1
2
int a[5];
char b[] = "hello";

  • 数组大小必须在编译期就作为一个常数确定下来。
  • 但C99中引入了变长数组,允许数组的维度是表达式 ,但在数组分配内存时,其表达式的值可以被求出。
  • 数组下标运算实际上都是通过指针进行的,也就是说a[4]与*(a+4)是等价的,甚至你会发现和4[a]也是一样的。
  • 数组名一般代表了指向该数组下标为0的元素的指针,并且printf(“%s\n”,hello)与printf(“%s\n”,&hello[0])等效。

数组和指针不相等

考虑下面的声明:

1
2
int c[4];//假设int占4字节
int *d;

对于上面的声明,编译器会给c预留内存空间4*4字节,并且数组名代表着指向数组第一个元素的指针。但对于d,却只为指针本身保留了内存空间。
所以此时有下面的操作:

1
2
3
4
5
c[3];        //合法
*(c+3); //合法
*d; //不合法,d指向了内存中不确定位置
c++; //不合法,一维数组名是指针常量,常量不可修改
d++; //可通过编译

另外,下面的两种情况也是不一样的:

1
2
char c[] = "hello";
char *d = "hello";

前者对字符数组a进行了初始化,后者将d指向了字符串常量。字符串常量存储在只读区,因此有下面的操作:

1
2
3
c[0] = 'H';  //合法,可修改数组内容
*d = 'H'; //不合法,字符串常量内容不可更改
d[0] = 'H' //不合法

数组名的含义

绝大多数情况,数组名都代表着指向该数组中下标为0的元素的指针,但是有例外:

1
2
int e[4];//假设int为4字节
sizeof(e);

上面的sizeof(e)的值并非4或8(指针占用空间),而是4*4 = 16。也就是说,当数组名被用作运算符sizeof的参数时,它的计算结果是整个数组的大小,而非第一个元素的指针大小。
再来看下面这种情况:

1
2
3
int temp[5];
&temp + 1;
temp + 1;

在这里,&temp指向整个数组,因此+1后指向了数组末尾,而temp指向数组第一个元素,+1后指向第二个元素。

数组长度计算

如何计算数组长度?考虑下面的代码:

1
2
3
4
int f[] = {1,2,3,4,5,6};
int *g = f;
size_t len_f = sizeof(f)/sizeof(int)//正确计算方法
size_t len_g = sizeof(g)/sizeof(int)

上面的len_f和len_g的值相等吗?显然并不相等。事实上,只有len_f到了数组f的长度,而len_g的值并没有任何实际意义。

不能作为参数的数组

所谓的数组不能作为参数,并不是指声明的数组不能作为参数传递,而是指当数组名作为参数时,数组名会被转换为指向该数组下标为0的元素的指针。
而下面的两种声明,其实也是等效的:

1
2
size_t arrayLen(const int *arr);
size_t arrayLen(const int arr[]);

我们来看一个例子,说明数组作为参数的情况:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#include <stdio.h>
int arraySum(const int arr[])
{
unsigned int loop = 0;
/*循环前计算好长度,提高性能*/
unsigned int len = sizeof(arr)/sizeof(int);
int sum = 0;
if(NULL == arr)
{
return 0;
}
for(loop = 0; loop < len; loop++)
{
sum+=arr[loop];
}
return sum;
}
int main(void)
{
int a[] = {1,2,3,4,5,6};
int sum = arraySum(a);
printf("arr sum is %d",sum);
return 0;
}

我们运行上面的程序,发现最终结果并不是我们预期的21,而是3。问题在于,a作为参数传入到arraySum中时,它是作为指针的,那么在函数内部计算sizeof(arr)自然只是得到了指针占用的内存大小。对于64位程序,这个大小是8,那么len的值为2,最终只计算了两个元素的和。

思考:该如何修改上面的程序才能得到正确的结果?

总结

我们来总结一下前面的核心内容:

  • 数组下标运算实际上都是通过指针进行的。
  • 数组名代表着指向该数组中下标为0的元素的指针,但有例外:sizeof(数组名)返回整个数组的大小,而非指针大小;&数组名返回一个指向数组的指针,而不是指向该数组中下标为0的元素的指针的指针。
  • 数组名作为参数时,数组名会被转换成指向该数组下标为0的元素的指针。
  • 指针操作可能比下标操作效率高,但可维护性却不一定有下标操作好。
  • 数组和指针不相等。

思考

下面的代码输出结果是什么?

1
2
3
4
5
6
7
8
9
#include<stdio.h>
int main(void)
{

int a[5] = {1,2,3,4,5};
int *p = (int*)(&a+1);
printf("%d,%d",*(a+1),*(p-1));
return 0;
}

守望 wechat
关注公众号[编程珠玑]获取更多原创技术文章
出入相友,守望相助!