C语言入坑指南-整型的隐式转换与溢出

前言

我们知道整型有无符号数和有符号数之分。如果我们对无符号数和有符号数处理不当,就可能造成难以预测的结果,尤其是在作为循环条件的时候,可能导致死循环。整型之间的运算还可能导致出现另外一个问题-溢出。本文将分别介绍它们。

隐式类型转换

我们看一下下面的程序:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

#include <stdio.h>
#include <string.h>
int main(void)
{
char *p = "hello";
int a = -1;
/*比较字符串的长度和a的大小*/
if(strlen(p) > a)
{
printf("len > a\n");
}
else
{
printf("len < a\n");
}
printf("%d\n",strlen(p));
return 0;
}

程序中,将字符“hello”的长度与-1进行比较,按照我们平常的认识,长度5肯定大于-1,最后应该会打印len > a。但是事实是,最后的输出结果如下:

1
2
len < a
5

最后的结果出乎我们的意料,为什么结果会是len < a?5明明大于-1啊!

原因在于有符号数与无符号数进行运算时,会发生隐式类型转换,有符号数会转换为无符号数
我们查看strlen的手册可以知道,它的返回值为size_t类型,虽然我们不能确定它到底是long unsigned int(64位程序)还是unsigned int(32位程序),但可以确定的是,它是一个无符号数。因此作为一个有符号数的-1和一个无符号数len进行比较时,-1会被转换为无符号数。
而负数是以补码的形式存储的,-1在内存中存储的是11111111 11111111 11111111 11111111,而它转换为无符号数,就变得很大了,即4294967295。因此,最后比较的结果必然是 len < a。

溢出

溢出指的是计算产生的结果很大,超出了该类型所能表示的范围。例如,int所能表示的最大值为2147483647,如果两个数相加的结果大于它,那么就会发生溢出。我们想当然的可以用这种巧妙的办法来判断是否溢出:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
#include <stdio.h>
int main(void)
{
int a = 0;
int b = 0;
scanf("%d,%d",&a,&b);
if(a+b < 0)
{
printf("overflow\n");
}
else
{
printf("%d",a+b);
}
return 0;
}

假如a和b的值都是正整数,按照我们前面的认识,如果发生了溢出,那么它是一个很大的数,而作为有符号数时,就是一个负数。既然如此,检测它们相加是否小于0不就可以知道是否溢出了吗?

虽然这个方法很多时候都能奏效,但不幸的是,溢出的结果是未定义的。也就是说,任何对于溢出后的假设都是不明智的。有些机器它的结果是可能是一个负数,但有的结果可能是一个代表溢出的特殊值,这个时候,这种检测方式就不再奏效了。

溢出检测

我们可以通过下面的方式来检测溢出:

1
2
3
4
if(a > INT_MAX - b)
{
printf("overflow\n");
}

我们利用整型的最大值减去其中一个数,然后与另一个数进行比较。其中INT_MAX定义在limit.h头文件中,它表示整数的最大值。
当然,我们还可以通过下面的方式来检测:

1
2
3
4
if((unsigned int)a + (unsigned int)b > INT_MAX)
{
printf("overflow\n");
}

将两个数都先转换成无符号数进行计算,运算后的结果与INT_MAX进行比较。

尽量避免

虽然我们有方法来检测溢出,但是我们建议的是尽量去避免溢出的发生。可以通过下面的方式来避免:

  • 选择合适的数据类型,当你的数据较大可能会超出short int的范围时,你就不该选择short int,而应该选择int等所表示范围更大的类型。
  • 在设计上尽量回避溢出。例如,要计算两个整数的平均值,我们想到的方法可能是(a+b)/2,但是这样却有溢出的风险,我们可以换一种方式:a-(a-b)/2,这种方式就回避了溢出的问题。

当然对于不可避免的可能发生溢出的情况,我们需要进行检测并进行后处理,而非忽略。

总结

对于整型隐式转换和溢出相关内容,我们做一个总结:

  • 避免有符号数和无符号数直接进行算术运算。
  • 一个很小的负数被转换成有符号数时,将会变得很大。因此一个无符号数和一个有符号负数的比较结果几乎是显而易见的。
  • 溢出的结果是未定义的,不要期望对它做任何假设。
  • 尽量避免溢出问题。
  • java中没有无符号数。

思考

基于第一个示例程序,有如下操作:

1
2
p[0] = 'H';  //操作1
sizeof(p); //操作2

  • 操作1合法吗?为什么?
  • 操作2的值是多少?
  • 为什么-1在内存中的存储为全1?

第一个问题的答案可以在C语言入坑指南-数组之谜中找到哦。

守望 wechat
关注公众号[编程珠玑]获取更多原创技术文章
出入相友,守望相助!