目录
前言
一、求字符串长度的函数
1.1 ❥ strlen
二、长度不受限制的字符串函数
2.1 ❥ strcpy
2.1.1 strcpy的模拟实现
2.2 ❥ strcat
2.2.1 strcat的模拟实现
2.2.2 字符串自己追加自己问题
2.3 ❥ strcmp
2.3.1 strcmp的模拟实现
三、长度受限制的字符串函数
3.1 ❥ strncpy
3.2 ❥ strncat
3.3 ❥ strncmp
四、字符串查找
4.1 ❥ strstr
4.1.1 strstr的模拟实现
4.2 ❥ strtok
五、错误信息报告
5.1 ❥ strerror
5.2 ❥ perror
前言
本节重点介绍处理字符串的库函数的使用和注意事项。
一、求字符串长度的函数
1.1 ❥ strlen
函数原型如下:
size_t strlen ( const char * str );
strlen函数:求字符串长度的函数
size_t: unsigned int 即无符号整型
注意事项
字符串是以'\0'作为结束的标志,strlen返回的是字符串'\0'之前出现的字符个数(不包括'\0')strlen的使用需要包含头文件:#include <string.h>参数指向的字符串必须以'\0'结尾我们看下面代码:
输出">"的原因:因为strlen的返回值是一个size_t类型的,也就是无符号的整形。
可以强制转换成int,这样就会输出"<="
代码如下:
当然,也得看用什么类型的变量接收与输出。
如下代码:
二、长度不受限制的字符串函数
2.1 ❥ strcpy
char* strcpy(char * destination, const char * source );
strncpy函数:字符串拷贝函数
destination:目标空间的起始地址
source:源字符串起始地址
使用strcpy函数代码如下:
这里为什么打印到good就不打印了呢,是因为把源字符串的'\0'拷贝到了目标空间。
验证:
注意事项
strlen的使用需要包含头文件:#include <string.h>源字符串必须以'\0'结尾会把源字符串的'\0'拷贝到目标空间目标空间必须足够大目标空间必须可修改
易错点1
代码如下:
#include <stdio.h>#include <string.h>int main(){char name[20] = {0};char arr[] = { 'a','b','c' };char* p=strcpy(name, arr);printf("%s", p);return 0;}
代码运行结果如下图所示:
因为字符数组里没有'\0',所以不能拷贝。
易错点2
代码如下:
#include <stdio.h>#include <string.h>int main(){char* p = "abcdef";char arr[20] = { 0 };char* ps = strcpy(p, arr); //目标区域不可修改printf("%s", ps);return 0;}
代码运行结果如下图所示:
不能这样写,程序会崩溃。这里是把数组内容拷贝到常量字符串里面去。该函数要求的目标空间必须是个变量,可变的数据才能进行更改。
2.1.1 strcpy的模拟实现
#include <stdio.h>#include <string.h>#include <assert.h>char* my_strcpy(char* dest, const char* src){char* ret = dest;//保留起始地址assert(dest != NULL);//断言,判断是否为空assert(src != NULL);while ((*dest++ = *src++)){;}return ret;}int main(){char arr1[20] = "abcdefg";char arr2[] = "good";char* p = my_strcpy(arr1, arr2);printf("%s", p);return 0;}
运行结果如图下图所示:
2.2 ❥ strcat
函数原型如下:
char* strcat(char* destination,const char* source);
strcat函数:字符串追加函数
代码如下:
注意事项
目标空间足够大,能够追加我们想要的数据(能容纳下源字符串的内容)目标空间必须可修改源字符串里必须有\0目标空间也得有'\0',否则不知道从哪里追加strcat的使用需要包含头文件:#include <string.h>2.2.1 strcat的模拟实现
#include <stdio.h>#include <string.h>#include <assert.h>char* my_strcat(char* dest, const char* src){char* ret = dest;assert(dest != NULL);assert(src != NULL);while (*dest){dest++;}while ((*dest++ = *src++)){;}return ret;}int main(){char arr1[20] = "hello ";char arr2[] = "world";char* p = my_strcat(arr1, arr2);printf("%s", p);return 0;}
2.2.2 字符串自己追加自己问题
字符串能否自己给自己追加呢?我们来看下面的代码:
代码1:是库函数strcat在vs2022 x64环境下运行的
代码2:是库函数在vs2022 x86环境下运行的
从上面两种运行环境可以看出,x64环境底下是可以运行出来,但x86环境底下程序会崩溃。所以尽量避免自己给自己追加。
而我们自己模拟实现的strcat函数,无论是在x64还是x86环境下程序都崩溃。(说明我们实现的字符串追加函数跟库函数strcat还是略有差异的)
代码运行结果如下:
综上所述,字符串不能自己给自己追加。原因如下:
可能会造成死循环,程序崩溃可能会越界访问
2.3 ❥ strcmp
int strcmp(const char * str1,const char * str2 );
strcmp函数:比较两个字符串是否相等的函数
strcmp代码如下:
#include <stdio.h>#include <string.h>int main(){char arr1[] = "abcdef";char arr2[] = "abcdg";int ret=strcmp(arr1, arr2);if (ret < 0){printf("<");}else if (ret > 0){printf(">");}else if (ret == 0){printf("=");}return 0;}
运行结果如下图所示:
说明比较的是该字符的ASCII值。
返回值是int的原因是:
第一个字符串<第二个字符串,则返回<0
第一个字符串=第二个字符串,则返回0
第一个字符串>第二个字符串,则返回>0
注意事项
strcmp的使用需要包含头文件:#include <string.h>比较的是字符的ASCII值。\0的ASCII最小。补充如下图:
2.3.1 strcmp的模拟实现
#include <stdio.h>#include <string.h>#include <assert.h>int my_strcmp(const char* str1, const char* str2){int ret = 0;assert(str1 != NULL);assert(str2 != NULL);while (*str1 == *str2){if (*str1 == '\0'){return 0;}str1++;str2++;}return *str1 - *str2;}int main(){char arr1[]= "abcdef";char arr2[] = "abcdg";int ret = my_strcmp(arr1, arr2);if (ret < 0)printf("<");else if (ret > 0)printf(">");else if (ret == 0)printf("=");return 0;}
三、长度受限制的字符串函数
3.1 ❥ strncpy
char * strncpy ( char * destination, const char * source, size_t num );
strncpy函数:字符串拷贝受限制的函数。
拷贝num个字符从源字符串到目标空间。
代码如下:
#include <stdio.h>#include <string.h>int main(){char arr1[] = "abcdefg";char arr2[] = "hello world";strncpy(arr1, arr2, 5);printf("%s", arr1);return 0;}
运行结果下图所示:
如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后面追加\0,直到num个。
代码如下图所示:
运行结果如下图所示:
注意'\0'的作用
代码如下:
运行结构如下图所示:
3.2 ❥ strncat
char * strncat ( char * destination, const char * source, size_t num );
strncat函数:长度受限制的字符串追加函数
将source指向的字符串的前num个字符追加到destination指向的字符串末尾,再追加一个'\0'字符。
代码如下:
#include <stdio.h>#include <string.h>int main(){char arr1[20] = "hello ";char arr2[] = "summer";strncat(arr1, arr2, 5);printf("%s", arr1);return 0;}
运行结果如下图所示:
调试结果如下图所示:
注意:arr1后要给定数组的大小,不给定就会由于初始化了6个,追加空间不够而报错。
如果source指向的字符串的长度小于num的时候,只会将字符串中到\0的内容追加到destination指向的字符串末尾。
代码如下所示:
#include <stdio.h>#include <string.h>int main(){char arr1[20] = "hello ";char arr2[] = "hh";strncat(arr1, arr2, 5);printf("%s", arr1);return 0;}
soucre字符串是否给自己追加'\0'?我们来测试一下,代码如下:
#include <stdio.h>#include <string.h>int main(){char arr1[20] = "hello\0xxxxxxxx";char arr2[] = "world";strncat(arr1, arr2, 5);printf("%s", arr1);return 0;}
因为\0是字符串结束的标志,此处追加5个字符,world在56789的位置,如果追加上一个\0,那么[10]的位置就是\0
从上图可看出,确实source自己给自己追加了 \0
3.3 ❥ strncmp
int strncmp ( const char * str1, const char * str2, size_t num );
strncmp函数:比较两个字符串内容是否相等(长度受限制)
比较str1和str2的前num个字符,如果相等就继续往后比较,最多比较num个字母,如果提前发现不一样,就提前结束。大的字符所在的字符串大于另外一个。如果num个字符都相等,就返回0。
代码如下:
#include <stdio.h>#include <string.h>int main(){char arr1[] = "abcdef";char arr2[] = "abcq";int ret = strncmp(arr1, arr2,4);printf("%d\n", ret);if (ret > 0){printf(">");}else if (ret < 0){printf("<");}else if (ret == 0){printf("=");}return 0;}
四、字符串查找
4.1 ❥ strstr
char * strstr ( const char * str1, const char * str2);
strstr函数:查找子串的一个函数。
代码如下:
#include <stdio.h>#include <string.h>int main(){char arr1[] = "abcdefg";char arr2[] = "bcd";char* p = strstr(arr1, arr2);printf("%s\n", p);printf("%p\n", p);return 0;}
注意
看str1里面有没有出现str2这个字符串,找到返回的是子串(str2)在串(str1)的起始地址。找不到返回的是空指针NULL。(函数返回字符串str2在字符串str1中第一次出现的位置)字符串的比较匹配不包含\0字符,以\0作为结束标志。
4.1.1 strstr的模拟实现
代码如下:
#include <stdio.h>#include <string.h>char* my_strstr(const char* str1, const char* str2){char* cp = (char*)str1;char* s1, * s2;if (!*str2)return((char*)str1);while (*cp){s1 = cp;s2 = (char*)str2;while (*s1 && *s2 && !(*s1 - *s2))s1++, s2++;if (!*s2)return(cp);cp++;}return(NULL);}int main(){char arr1[] = "abcccdefgh";char arr2[] = "cde";char* ret = my_strstr(arr1, arr2);if (ret == NULL){printf("子串不存在\n");}else{printf("%s\n", ret);}return 0;}
4.2 ❥ strtok
char * strtok ( char * str, const char * sep);
strtok函数:切割字符串(可以把想要的串给切割出来)
第二个参数sep是个字符串,定义了当作分隔符的字符集合。
第一个参数str指定一个字符串,它包含了0个或者多个有sep字符串中一个或者多个分隔符分割的标记。
我们接下来拿这个字符串举例:tiantian@earth.com(sep为"@.")
strtok函数找到str中的下一个标记,并将其用\0结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
strtok函数的第一个参数不为NULL,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。 strtok函数的第一个参数为NULL,函数将在同一个字符串中被保存的位置开始,查找下一个标记。如果字符串中不存在更多的标记,则返回NULL指针。
代码如下:
#include <stdio.h>#include <string.h>int main(){char arr1[20] = "tiantian@earth.com";const char* sep = "@.";char arr2[20] = { 0 };strcpy(arr2, arr1);char* ret = strtok(arr2, sep);printf("%s\n", ret); ret = strtok(NULL, sep);printf("%s\n", ret); ret = strtok(NULL, sep);printf("%s\n", ret);return 0;}
运行结果如图所示:
以上是将字符串分成3次的结果,那如果继续打印,会发生什么现象呢?我们来测试一下。
从上图可以看出,当我们打印到最后还要继续打印的时候,就会显示一个空字符串,就是什么都找不到的意思,因为str已经是一个空指针了。
但是我们发现,上面那种写法是有弊端的,因为不清楚有多少字段,也就不知道调用几次函数,所以我们可以这样写来完善这一点:
#include <stdio.h>#include <string.h>int main(){char arr1[20] = "tiantian@earth.com";const char* sep = "@.";char arr2[20] = { 0 };strcpy(arr2, arr1);char* ret = NULL;for (strtok(arr2, sep); ret != NULL; strtok(NULL, sep)){printf("%s\n", ret);}return 0;}
五、错误信息报告
5.1 ❥ strerror
char * strerror ( int errnum );
strerror函数:错误报告函数。(返回错误码,所对应的错误信息)
strerror函数可以把参数部分错误码所对应的错误信息的字符串地址返回来。
在不同的系统和C语言标准库的实现中都规定了一些错误码,一般是放在errno.h这个头文件中说明的,C语言程序启动时就会使用一个全局的变量errno来记录程序当前的错误码。只不过程序启动的时候errno是0,表示没有错误,当我们在使用标准库中的函数的时候发生了某种错误,就会让对应的错误码,存放在errno中。而一个错误码的数字是整数很难理解是什么意思,所以每一个错误码都是有对应的错误信息的。strerror函数就可以将错误对应的错误信息字符串的地址返回。
例如下面的代码:
5.2 ❥ perror
perror== printf+strerror
perror函数可以直接打印错误信息。打印的时候,先打印传给perror的字符串,然后打印一个冒号,紧接着打印一个空格,最后打印错误码对应的错误信息。
代码如下:
#include <stdio.h>#include <string.h>int main(){FILE* pf = fopen("test.txt", "r");if (pf == NULL){perror("zhangsan");return 1;}return 0;}
运行结果如下所示: