Description
请你来实现一个 atoi 函数,使其能将字符串转换成整数。
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。
当我们寻找到的第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字组合起来,作为该整数的正负号;假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。
该字符串除了有效的整数部分之后也可能会存在多余的字符,这些字符可以被忽略,它们对于函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换。
在任何情况下,若函数不能进行有效的转换时,请返回 0。
说明:
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−2^31, 2^31 − 1] 。如果数值超过这个范围,请返回 INT_MAX (2^31 − 1) 或 INT_MIN (−2^31) 。
Analyze
题目标的难度 Medium,但做下来并没有感觉到中等的难度,看题目也知道主要是考虑溢出的情况,那这样看来跟 LeetCode 7. 整数反转 差不多的方法
给定的函数如下:
- @param str 字符串
- @return 符合要求的整数
主要思路很简单,就是按题目要求一点点的把不符合要求的字符过滤掉
Realization
- 设定正负判断和溢出标志
最终的数字用 long 类型的变量储存,防止溢出;设定正负标志,初始化为 1,如果检测到字符串中出现 ' - ' 的话就把标志置为 -1
- 去除字符串前端的空格
把下标定位到第一个不是空格的位置
- 判断符号位
当空格全部取出之后,下一个字符有可能是我们需要的符号位,因此在正式计算之前需要判断符号位,如果出现了符号位,要把符号标志变为对应的数并把此位取出,如果是数字直接到数字处理部分,而如果是其他的字符的话不符合条件,直接返回 0
- 计算和溢出处理
当检测到字符为非数字字符就退出循环,而把一个数字字符变成数字只需要用这个字符减去 0 这个字符就行了,因为字符计算是通过 ASCII 码表示的,这里只判断 sum 的上限溢出是因为前面已经把符号位去除了, sum 记录的其实是要返回的数的绝对值
- 返回
符合条件,返回数字乘以符号位
-
提交
Dictionary
思路清晰的话这么点判断分支还是很简单的,只要注意用 long 类型来防止 int 类型的溢出即可,同时,关于最后的溢出返回处理,有人可能觉得再循环体内先计算,不要判断返回,等循环结束了再判断是否溢出,这样只需要在最后判断一次,很快很多,实际上这样做是不对的,因为对于一串字符串来说,他转换成一个整数可能是及其大的,有可能 long、long long 类型都存不下,因此需要在 sum 刚溢出的时候马上做出判断,所以在循环体里面判断是必不可少的。
在准备发布这篇文章的时候笔者突然发现了这个解法的一个 BUG ,同时也是 LeetCode 测试案例的缺漏吧。
这个解法是暂时不考虑符号位的,就是 sum 是一个绝对值的值,再结合判断溢出的条件 sum > INT_MAX,以及 int类型的取值范围 [-2147483648,2147483647] 不难发现,如果我得到的 sum 等于 2147483648,即 INT_MAX + 1 ,并且符号位为 -1 的话,那么从字符串提取到的整数应该是 -2147483648 ,按题意这个数是不溢出的,所以应该返回这个数,但在这个程序中,因为 2147483648 > 2147483647,所以在循环里直接返回 INT_MIN 了,这一点显然是不对的。
由于这道题这种解法是通过了的,所以笔者就没有修改,但在这里提出,实际上修改的话可以把判断溢出的 INT_MAX 改成 INT_MIN 的绝对值,保证它不在上述情况直接返回 0 ,然后再返回数值之前加一个判断就可以了。
附源代码
/*
* @lc app=leetcode.cn id=8 lang=c
*
* [8] 字符串转换整数 (atoi)
*/
// @lc code=start
int myAtoi(char * str){
int i;
int character = 1;
long sum = 0;
for(i = 0; str[i]; ++i)
{
if(str[i] != ' ')break;
}
if(str[i] == '+')
{
++i;
}
else if(str[i] == '-')
{
++i;
character = -1;
}
else if(str[i]<'0' || str[i]>'9')
{
return 0;
}
for(; str[i]>='0' && str[i]<='9'; ++i)
{
sum = 10*sum + str[i]-'0';
if(sum > INT_MAX) return character == -1 ? INT_MIN : INT_MAX;
}
return sum*character;
}
// @lc code=end