当前位置:首页 » 《随便一记》 » 正文

C语言篇 + 字符串处理函数和内存函数的介绍及模拟实现(避开你的语法坑,请注意查收)_m0_53421868的博客

15 人参与  2021年12月19日 13:42  分类 : 《随便一记》  评论

点击全文阅读


在这里插入图片描述

目录

  • 前言
  • C语言的库函数分类
  • 求字符串长度
    • strlen
    • strlen函数的模拟实现
      • 非递归写法
      • 递归写法
      • 指针相减法
  • 长度不受限制的字符串函数
    • strcpy
      • 举例1、
      • 举例2、
      • 举例3、
    • strcat
    • strcmp
  • 长度受限制的字符串函数介绍
    • strncpy
    • strncat
    • strncmp
  • 字符串查找
    • strstr
    • strtok
  • 错误信息报告
    • strerror
  • 内存操作函数
    • memcpy
      • memcpy内存重叠问题继续探讨,memmove的引入
    • memmove
      • memmove的模拟实现
    • memset
    • memcmp

前言

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在 常量字符串 中 或者 字符数组 中。 字符串常量, 适用于那些对它不做修改的字符串函数

C语言的库函数分类

  • IO函数 prntf、scanf

    字符函数

    字符串函数

    内存函数

    时间日期函数

    数学函数

重点会讲解常用的,本次的内容主要在介绍内存函数和字符串函数

求字符串长度

strlen

在这里插入图片描述

  • 字符串已经 ‘\0’ 作为结束标志,strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包含 ‘\0’ )。

    参数指向的字符串必须要以 ‘\0’ 结束。

    注意函数的返回值为size_t,是无符号的( 易错 )

    学会strlen函数的模拟实现

在这里插入图片描述

char arr[] = "hello Mozart";
size_t len = strlen()

strlen的一些小细节

void functest() 
{
	char arr1[] = "abdc";
	char arr2[] = "abdef";

	if (strlen(arr1) - strlen(arr2) > 0) 
	{
		printf("hehe\n");
	}
	else
	{
		printf("haha\n");
	}
}

会打印hehe,因为返回值类型是size_t,是一个无符号类型的结果,(并不会存在负数),当然强制类型转换就会得到一个有符号类型的结果(存在负数)

void functest() 
{
	char arr1[] = "abdc";
	char arr2[] = "abdde";

	if ((int)strlen(arr1) - (int)strlen(arr2) > 0) 
	{
		printf("hehe\n");
	}
	else
	{
		printf("haha\n");
	}
}

strlen函数的模拟实现

非递归写法

//非递归写法
int my_strlen(char* str)
 {
 	int count = 0;
 	while('\0' != *str)
 	{
 		count++;
 		str++;
 	}
 	return count;
 }

递归写法

//递归写法
nt my_strlen(char *str)
{
	if('\0' == *str)
		return 0;
	else
		return 1+my_strlen(1+str);
}

指针相减法

int my_strlen(char* str)
 {
 	char *dest = str;
	while(*dest++)
 	{
 		;
 	}
 	//除去‘\0’
 	return dest - str - 1;
 }

长度不受限制的字符串函数

strcpy

在这里插入图片描述
使用时注意事项

  • 源字符串必须以 ‘\0’ 结束。

    会将源字符串中的 ‘\0’ 拷贝到目标空间。

    目标空间必须足够大,以确保能存放源字符串。

    目标空间必须可变。

    学会模拟实现。

举例1、

void functest() 
{
	char arr1[] = "xxxxxxxxxxxx";
	char arr2[] = "abcd";

	strcpy(arr1,arr2);
	printf("%s ",arr1);
}

会将字符串的结束标记 ’ \0’也给拷贝进去,直到遇到 ’ \0 ',strcpy的工作也就结束了

在这里插入图片描述

举例2、

目标空间足够大

依然是使用原来的代码,方便大家理解,在这里可以看到要想将arr2的内容拷贝至arr1,arr1的空间必须足够大,实际上并没有给出一块合适的空间来预存arr2的内容,那么后果也是可想而知

void functest() 
{
	char arr1[] = "xxx";
	char arr2[] = "abcd";

	strcpy(arr1,arr2);//err
	printf("%s ",arr1);
}

在这里插入图片描述

举例3、

目标空间必须可变,在学习指针的时候还记得字符指针用来存放字符首地址吗
char *ptr = "hello Mozart"
为了保护字符串习惯于在前面加const
const char *ptr = "hello Mozart"

代码可不能这样写哦,受const保护的字符串是不允许被修改的

void functest() 
{
	const char* ptr1 = "xxxxxxx";
	char* ptr2 = "abc";
	strcpy(ptr1,ptr2);//err
	printf("%s ",ptr1);
}

strcpy模拟实现

char *my_strcpy(char *dest,const char *src) 
{
	assert(dest && src);
	char *tmp = dest;
	while (*tmp ++ = *src++) 
	{
		;
	}
	
	return dest;
}

strcat

又叫字符串链接和字符串追加
在这里插入图片描述

  • 源字符串必须以 ‘\0’ 结束。

    目标空间必须有足够的大,能容纳下源字符串的内容。

    目标空间必须可修改。

    字符串自己给自己追加,如何?

    使用示范

void func3()
{
	char arr[20] = "abcdef";
	//char arr[] = "abcdef";  err,空间不够
	strcat(arr,"def");
	printf("%s ",arr);
}

int main() 
{
	func3();
	return 0;
}

如果你在使用strcat的时候遇到过这种情况,只需要在程序最开始的位置处加一个宏定义

在这里插入图片描述
在这里插入图片描述
错误示范

void func3()
{
	char arr1[20] = "abcdef";
	char arr2[20] = {'a','b','c'}; //字符数组末尾没加‘\0’
	strcat(arr1, arr2);
	printf("%s ",arr1);
}

int main() 
{
	func3();
	char arr;
	scanf("%s ",&arr);
	return 0;
}

当想将一个字符数组arr2的内容追加到另外一个字符数组arr1中去,strcat是遇到 ‘\0’ 才会停止追加字符的,而arr2中并未出现
‘\0’,由于在内存中‘\0’的出现时机并不是很明确,可能在‘\0’还未出现之前,追加过去的字符内容就已经足以导致arr1越界了,可能存在越界,但是程序是明显崩了,这一点请务必注意
在这里插入图片描述

模拟实现strcat

整体思路就是找到源字符串的末尾位置,存放‘\0’的位置处,从这里开始将待追加字符串全部拷贝过去

在这里插入图片描述

char * my_strcat(char *s1, const char * s2)
{
	//防止对空指针解引用
	assert(s1 && s2);
	char *dest = s1;
	while (*dest)
	{
		dest++;
	}
	while (*dest++ = *s2++)
	{
		;
	}
	// strcat返回的是目标空间的起始地址
	return s1;
}

strcmp

是比较字符串的内容(Ascii码值),并不是比较长度

在这里插入图片描述

  • 标准规定:

    第一个字符串大于第二个字符串,则返回大于0的数字

    第一个字符串等于第二个字符串,则返回0

    第一个字符串小于第二个字符串,则返回小于0的数字

    那么如何判断两个字符串?

可以通过strcmp的返回值来比较字符串的大小

void func3()
{
	char arr1[] = "abdc";
	char arr2[] = "abdc";
	int ret = strcmp(arr1,arr2);
	if (ret > 0)
		printf(">\n");
	else if (ret == 0)
		printf("==\n");
	else
		printf("<\n");
}

模拟实现strcmp

//模拟实现strcmp
int my_strcmp(const char *s1, const char * s2)
{
   //防止对空指针解引用
	assert(s1 && s2);

	while (*s1 == *s2)
	{
		if (!(*s1))
			return 0;
		++s1;
		++s2;
	}
	return *s1 - *s2;
}

长度受限制的字符串函数介绍

相对于上面的函数使用起来会更安全,但是功能上是一样的

strncpy

在这里插入图片描述

  • 拷贝num个字符从源字符串到目标空间。

    如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个

void func3()
{
	char arr1[12] = "abdc";
	char arr2[] = "abdc";
	strncpy(arr1,"xxxxxxxxxxx",11);
	printf("%s ",arr1);
}

源字符串的长度刚好等于num
在这里插入图片描述
当源字符串的长度刚好小于num,在字符串后面补0
在这里插入图片描述

strncat

在这里插入图片描述

  • 将源的第一个num字符附加到目标,再加上一个结束的空字符。

    如果source中的C字符串长度小于num,则只复制到终止空字符’\0’之前的内容

可以指定追加num个字符

void func3()
{
	char arr1[] = "abcd\0xxxxxxxxxx";
	char arr2[] = "defg";
	strncat(arr1, arr2,3);
	printf("%s ",arr1);
}

可以看出是在目标字符串的‘\0’位置开始追加3个字符,末尾自动补‘\0’

在这里插入图片描述

strncmp

在这里插入图片描述

  • 比较到出现另个字符不一样或者一个字符串结束或者num个字符全部比较完

指定比较两个字符串出现的前num个字符

void func3()
{
	char arr1[] = "abcdxxxxxxxxxx";
	char arr2[] = "abcd";
	//比较字符串的内容
	if(!strncmp(arr1, arr2, 4))
		printf("相等\n");
	else
		printf("不相等\n");

}

字符串查找

strstr

在这里插入图片描述

  • 返回一个指向str1中第一次出现的str2的指针,如果str2不是str1的一部分,则返回一个空指针。
void func3()
{
	char arr1[] = "abcdxxxxxxxxxx";
	char *ret = strstr(arr1,"abcd");
	if (ret == NULL)
		printf("找不到");
	else
	//找到了就打印该字符串
		printf("%s ", ret);

}

模拟实现

基本思路:备份两个字符串的起始地址,s1表示字符串的首地址,s2表示子串的首地址,
1、s1和s2同时走的情况,*s1 == *s2
2、如果 * s1 != * s2,那么cp++,因为前一个字符都已经不相等了,就可以从后面的字符中开始找字串
3、s1找着找着中途不与s2相等了,那么s1回到它的开始处查找(cp的位置),而s2依然是从它的起始位置开始,s1和s2继续比较

char *my_strstr(const char *str1, const char *str2)
{
	assert(str1 && str2);
	char *cp = str1, *s1 ,*s2;
	while (*cp) 
	{
		//cp记录str1起始位置
		s1 = cp;
		//s2记录sr2的起始位置
		s2 = str2;
		while (*s1 != '\0' && *s2 != '\0' && *s1 == *s2) 
		{
			s1++;
			s2++;
		}
		//找到的情况
		if (*s2 == '\0')
			return cp;
		//如果没有找到cp++
		cp++;
	}
	return NULL;
}

比较的好的情况
在这里插入图片描述
不好的情况
在这里插入图片描述

strtok

在这里插入图片描述

  • sep参数是个字符串,定义了用作分隔符的字符集合

    第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。

    strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:strtok函数会改
    变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)

    strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。

    strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。

    如果字符串中不存在更多的标记,则返回 NULL 指针

int main()
{
	char arr1[] = "CSDN@IT莫扎特.Mozart";
	char arr2[40] = { 0 };
	// 临时拷贝的内容
	strcpy(arr2,arr1);
	//用作分隔符的字符集合
	char tmp[] = "@.";
	
	for (char *ret = strtok(arr2, tmp); ret != NULL; ret = strtok(NULL, tmp))
	{
	//打印返回的字符串
		printf("%s \n",ret);
	}
}

使用效果还是很明显的
在这里插入图片描述
希望我梳理的流程图对你有所帮助
在这里插入图片描述

错误信息报告

strerror

在这里插入图片描述

解释errnum的值,生成一个带有描述错误条件的消息的字符串,就像被库的函数设置为errno一样。
返回的指针指向一个静态分配的字符串,程序不能修改该字符串。对这个函数的进一步调用可能会覆盖它的内容(不需要特定的库实现来避免数据竞争)。
strerror产生的错误字符串可能是特定于每个系统和库实现的。

c语言会将库函数的错误信息存放到errnum
这个变量当中,每个错误码都会有一条它的具体信息,strerror可以返回c语言错误码对应的信息,

以下举得几个例子就当对这个函数的了解,有兴趣可以自己去研究研究

	printf("%s \n", strerror(0));
	printf("%s \n", strerror(1));
	printf("%s \n", strerror(2));
	printf("%s \n", strerror(3));

在这里插入图片描述

int main()
{
	 FILE *pf = fopen("test.txt","r");
	 if(pf == NULL)
	 {
	 	printf("%s \n",strerror(errno));
	 	写成下面这个函数也是可以
	 	//perror("错误信息:\n");
	 }
	 else
	 {
	 	printf("文件打开成功\n");
	 }
	 
	return 0;
}
 

内存操作函数

memcpy

在这里插入图片描述
官方文档

  • 将num字节的值从source所指向的位置直接复制到destination所指向的内存块。

    源指针和目标指针所指向的对象的底层类型与此函数无关;结果是数据的二进制副本。

    该函数不检查source中是否有任何终止的空字符——它总是精确地复制num字节。

    为了避免溢出,目标和源参数所指向的数组的大小必须至少为num字节,并且不能重叠(对于重叠的内存块,memmove是一种更安全的方法)。

C语言中文网解读

memcpy() 用来复制内存,其原型为:
void * memcpy ( void * dest, const void * src, size_t num );

memcpy() 会复制 src 所指的内存内容的前 num 个字节到 dest 所指的内存地址上。

memcpy() 并不关心被复制的数据类型,只是逐字节地进行复制,这给函数的使用带来了很大的灵活性,可以面向任何数据类型进行复制。

需要注意的是: dest 指针要分配足够的空间,也即大于等于 num 字节的空间。如果没有分配空间,会出现断错误。 dest 和 src
所指的内存空间不能重叠(如果发生了重叠,使用 memmove() 会更加安全)。
稍后再来解决memcpy函数内存重叠的问题

与 strcpy() 不同的是,memcpy() 会完整的复制 num 个字节,不会因为遇到“\0”而结束。

【返回值】返回指向 dest 的指针。注意返回的指针类型是 void,使用时一般要进行强制类型转换。

举例使用

将一个数组中的内容拷贝到另一个数组中去

int arr1[10] = {9,8,7,6,5,4,3,2,1,0};
	int arr2[10] = { 0 };
	memcpy(arr2,arr1,sizeof(int) * 10);
	for (int i = 0; i < 10; i++) 
	{
		printf("%d ",arr2[i]);
	}

模拟实现

思路:
原数组拷贝到目标数组中,拷贝的是数据,而数据又分类型,为了更方便的达到实现的目的,将使用一个字节一个字节地拷贝
在这里插入图片描述
一个字节一个字节拷贝在这里插入图片描述

void * my_memcpy(void * dest, const void * src, size_t num)
{
	assert(dest && src);
	void * tmp = dest;
	while (num--) 
	{
		//一个字节拷贝
		*(char *)dest = *(char *)src;
		//dest指向下一个字节
		dest = (char *)dest + 1;
		//src指向下一个字节
		src = (char *)src + 1;
	}
	return tmp;
}
int main()
{
	int arr1[10] = {0,1,2,3,4,5,6,7,8,9};
	int arr2[10] = { 0 };
	my_memcpy(arr2,arr1,sizeof(int) * 10);
	for (int i = 0; i < 10; i++) 
	{
		printf("%d ",arr2[i]);
	}
}

最终的效果
在这里插入图片描述

memcpy内存重叠问题继续探讨,memmove的引入

这里会有一个内存被覆盖的问题

	int arr[10] = {0,1,2,3,4,5,6,7,8,9};
	
	my_memcpy(arr + 2,arr,16);
	for (int i = 0; i < 10; i++) 
	{
		printf("%d ",arr[i]);
	}

从起始地址arr每每间隔两个整形(arr + 2),每次拷贝一字节,循环16次(4 * 4)int * 4,相当于用前两个整形元素覆盖掉后面两个整形元素
在这里插入图片描述
执行结果也确是如此要想解决这个问题就得引入memmove在这里插入图片描述

memmove

在这里插入图片描述

  • 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。

    如果源空间和目标空间出现重叠,就得使用memmove函数处理

使用memmove后,可以看出效果还是很明显的不会发生内存重叠
在这里插入图片描述

int main()
{
	int arr[10] = {0,1,2,3,4,5,6,7,8,9};
	
	memmove(arr + 2,arr,16);
	for (int i = 0; i < 10; i++) 
	{
		printf("%d ",arr[i]);
	}
	return 0;
}

memmove的模拟实现

思路:要想实现内存不重叠,将原数据src拷贝到目标数据dest,那么前提是从前往后拷贝呢?还是从后往前拷贝?
在这里插入图片描述
从前往后拷贝

思考:可以看出如果是从前往后拷贝,那么3 4就已经被覆盖了,原本的数据也被改成了1 2,再将数据拷贝到5 6的时候那么就是1 2 1 2 1
2 7 8 9 10了,很明显不符合我们想达到的预期结果

请添加图片描述

从后往前拷贝

思考:那么这种情况就很符合我们的预期结果了

请添加图片描述
但仅仅是这样思考 还是不够

思考:如果dest和src的位置互换了之后呢? 即使是从后向前拷贝数据还是被覆盖了

请添加图片描述
解决方案: dest 在 src的左边,从前往后拷贝
在这里插入图片描述
src在dest的左边,从后向前拷贝

在这里插入图片描述

重叠的情况,从后向前
在这里插入图片描述

dest 在 src的右边,从后往前拷贝,从后往前拷贝都可以
在这里插入图片描述
梳理逻辑
在这里插入图片描述

实现代码

void *my_memove(void *dest,const void *src,size_t count) 
{
	assert(dest && src);
	void *ret = dest;

	if (dest < src) 
	{
		//从前向后拷贝

		while (count--) 
		{
			*(char *)dest = *(char *)src;
			//指针往后偏移
			dest = (char*)dest + 1;
			src = (char*)src + 1;
		}	
	}
	else 
	{
		//从后向前拷贝
		while (count--) //count的大小决定了指针偏移到了哪个位置
		{
			*((char*)dest + count) = *((char*)src + count);
		}
	}

	return ret;
}

memset

在这里插入图片描述

将ptr指向的内存块的第一个num字节设置为指定的值(解释为unsigned char)。

在这里插入图片描述

	int arr[5] = { 1,2,3,4,5 };
	memset(arr,0,20);

memcmp

在这里插入图片描述

比较ptr1指向的内存块的第一个num字节和ptr2指向的第一个num字节,如果它们都匹配则返回0,如果不匹配则返回一个不同于0的值,表示哪个值更大。

注意,与strcmp不同,该函数在找到空字符后不会停止比较。

内存比较函数,比较的是内存中的内容

	int arr1[10] = { 0,1,2,3,4,5,6,7,8,9 };// 00 00 00 00 01 00 00 00 02 00 00 00
	int arr2[10] = { 0,1,2,3,4,5,6,7,8,9 };//00 00 00 00 01 00 00 00 02 00 00 00
	if (memcmp(arr1, arr2, 13) == 0)
		printf("相等\n");
	else
		printf("不相等\n");

点击全文阅读


本文链接:http://zhangshiyu.com/post/31739.html

字符串  函数  拷贝  
<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1