本文主要介绍一些常用的字符串库函数的模拟实现,首先,我们来看一下都有哪些函数:
字符串说明 | 字符串类型 |
---|---|
求字符串长度 | strlen |
长度不受限制的字符串函数 | strcpy、strcat、strcmp |
长度受限制的字符串函数 | strncpy、strncat、strncmp |
字符串查找 | strstr、strtok |
错误信息报告 | strerror |
内存操作函数 | memcpy、memmove、memset、memcmp |
接下来,我们就一个一个来进行分析,并模拟实现。
在这里,推荐一个网站cplusplus,在这里面可以查看每个库函数的具体结构和组成框架。
1. strlen函数的模拟实现
函数作用:求解字符串长度。
size_t strlen ( const char * str );
- 字符串的
'\0'
作为结束标志,strlen
函数返回的是在字符串中'\0'
前面出现的字符个数(不包含'\0'
)。 - 参数指向的字符串必须要以
'\0'
结束。 - 注意函数的返回值为
size_t
,是无符号的。
方法一
:计数器方式(也是最常用的一种)
#include <stdio.h>
#include <assert.h>
//模拟实现strlen
int my_strlen(const char* arr)
{
assert(arr);
int count = 0;
while (*arr != '\0')
{
*arr++;
count++;
}
return count;
}
int main()
{
char arr[] = "abc";
int ret = my_strlen(arr);
printf("%d\n", ret);
return 0;
}
【注意】
代码中const
修饰的指针类型表示指针指向的内容不可更改。
assert
语句称为断言,它的本质就是一个宏,宏之中是一个表达式。
“断言”:
如果表达式为真,断言通过,进行之后的逻辑。
如果表达式为假,断言失败,程序主动停止,直接退出。
方法二
递归方式(不创建临时变量)
#include <stdio.h>
#include <assert.h>
int my_strlen(const char * str)
{
if(*str == '\0')
return 0;
else
return 1 + my_strlen(str+1);
}
int main()
{
char arr[] = "abc";
int ret = my_strlen(arr);
printf("%d\n", ret);
return 0;
}
方法三
指针-指针的方式
#include <stdio.h>
#include <assert.h>
int my_strlen( char* arr)
{
char* p = arr;
while (*p != '\0' )
{
p++;
}
return p - arr;
}
int main()
{
char arr[] = "abc";
int ret = my_strlen(arr);
printf("%d\n", ret);
return 0;
}
2. strcpy函数的模拟实现
函数作用:将一个字符串拷贝到另一个字符串中。
char* strcpy(char * destination, const char * source )
- 源字符串必须以
'\0'
结束。 - 会将源字符串中的
'\0'
拷贝到目标空间。 - 目标空间必须足够大,以确保能存放源字符串。
- 目标空间必须可变。
#include <stdio.h>
#include <assert.h>
char* my_strcpy(char* s1, const char* s2)
{
assert(s1 && s2);
char* ret = s1;
while (*s1++ = *s2++)
{
;
}
return ret;//这里返回的是目标函数的首地址
}
int main()
{
char arr1[20] = "abc";
char arr2[] = "erty";
my_strcpy(arr1,arr2);
printf("%s\n", arr1);
return 0;
}
3. strcat函数的模拟实现
函数作用:字符串追加,拼接两个字符串。
char * strcat ( char * destination, const char * source );
- 源字符串必须以
'\0'
结束。 - 目标空间必须有足够的大,能容纳下源字符串的内容。
- 目标空间必须可修改。
#include <stdio.h>
#include <assert.h>
char* my_strcat(char* s1, const char* s2)
{
assert(s1 && s2);
char* ret = s1;
//strcat返回的是目标空间的起始地址,所以先将起始地址存在ret里面
//1.找到目标字符串的‘\0’
while (*s1 != '\0')
{
s1++;
}
//2.追加源字符串到'\0'
while (*s1++ = *s2++)//strcpy里面的功能
{
;
}
return ret;
}
int main()
{
char arr1[20] = "abc";
char arr2[] = "erty";
my_strcat(arr1, arr2);
printf("%s\n", arr1);
return 0;
}
4. strcmp函数的模拟实现
int strcmp ( const char * str1, const char * str2 );
函数作用:字符串比较。
【标准规定】:
因为返回值是int
类型,所以,
第一个字符串大于第二个字符串,则返回大于0
的数字。
第一个字符串等于第二个字符串,则返回0
。
第一个字符串小于第二个字符串,则返回小于0
的数字。
#include <stdio.h>
#include <assert.h>
int my_strcmp(const char* s1, const char* s2)
{
assert(s1 && s2);
while (*s1 == *s2)
{
if (*s1 == '\0')
{
return 0;
}
s1++;
s2++;
}
return *s1 - *s2;
}
int main()
{
//strcmp比较的是字符串的内容,而不是长度
char arr1[] = "abcdef";
char arr2[] = "abdfg";
int ret = my_strcmp(arr1, arr2);
if (ret == 0)
{
printf("=\n");
}
else if (ret < 0)
{
printf("<\n");
}
else
{
printf(">\n");
}
return 0;
}
5. strstr函数的模拟实现
char * strstr ( const char *str2, const char * str1);
函数作用:在一个字符串中查找其子字符串。
#include <stdio.h>
#include <assert.h>
char* my_strstr(const char* str1, const char* str2)
{
assert(str1 && str2);
char* s1;
char* s2;
char* cp = str1;
if (*str2 == '\0') //如果str2为一个空字符串,则返回str1
return str1;
while (*cp) //abbbcde bbc
{
s1 = cp;
s2 = str2;
//while (*s2 !='\0' && *s1 != '\0' && *s1 == *s2)
while (*s2 && *s1 && *s1 == *s2)
{
s1++;
s2++;
}
if (*s2 == '\0')
{
return cp;
}
cp++;
}
return NULL;//找不到
}
int main()
{
char arr1[] = "i love china";
char arr2[] = "china";
char* ret = my_strstr(arr1, arr2);
//查找arr2在arr1中第一次出现的位置,返回的是一个地址
if (ret == NULL)
{
printf("找不到\n");
}
else
{
printf("%s\n",ret);
}
return 0;
}
6. strtok函数
char * strtok ( char * str, const char * sep );
函数作用:字符串分割。
sep
参数是个字符串,定义了用作分隔符的字符集合。- 第一个参数指定一个字符串,它包含了
0
个或者多个由sep
字符串中一个或者多个分隔符分割的标记。 strtok
函数找到str
中的下一个标记,并将其用\0
结尾,返回一个指向这个标记的指针。(注:strtok
函数会改变被操作的字符串,所以在使用strtok
函数切分的字符串一般都是临时拷贝的内容并且可修改。)strtok
函数的第一个参数不为NULL
,函数将找到str
中第一个标记,strtok
函数将保存它在字符串中的位置。strtok
函数的第一个参数为NULL
,函数将在同一个字符串中被保存的位置开始,查找下一个标记。- 如果字符串中不存在更多的标记,则返回
NULL
指针。
int main()
{
char str1[] = "123445.qq.com";
char str2[100] = { 0 };
char sep[] = ".";
strcpy(str2, str1);
char* ret = NULL;
//分割字符串
for (ret = strtok(str2, sep); ret != NULL;ret = strtok(NULL,sep))
{
printf("%s\n", ret);
}
/*strtok(str2, sep);
strtok(NULL, sep);*/
return 0;
}
7. strerror函数
char * strerror ( int errnum );
函数作用:错误码。默认情况下,errno值为0 ,即No error,无错误。
strerror
函数根据返回的错误码,返回对应的错误信息。
要想使用errno
需要包含头文件<error.h>
。在其基础上想使用strerror
函数需要包含头文件<string.h>
。
#include <stdio.h>
#include <string.h>
#include <errno.h>//必须包含的头文件
int main() {
FILE *pFile = fopen("a.txt", "r");
if (pFile == NULL)
printf ("Error opening file unexist.ent: %s\n",strerror(errno));
//errno: Last error number
return 0;
}
8. memcpy函数的模拟实现
void * memcpy ( void * destination, const void * source, size_t num );
函数作用:内存拷贝
- 函数
memcpy
从source
的位置开始向后复制num
个字节的数据到destination
的内存位置。 - 这个函数在遇到
'\0'
的时候并不会停下来。 - 如果
source
和destination
有任何的重叠,复制的结果都是未定义的。
#include <stdio.h>
#include <string.h>
void* my_memcpy(void* dest, const void* src, size_t count)
{
assert(src && dest);
void* ret = dest;
while(count--)
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;//跳过一个字节
src = (char*)src + 1;
}
return ret;//返回目标空间的起始地址
}
int main()
{
int arr1[10] = { 1, 2, 3, 4, 5, 6, 7, 8, 9 };
int arr2[20] = { 0 };
//拷贝的是整形类型
my_memcpy(arr2, arr1, 10 * sizeof(int));
int i = 0;
for ( i = 0; i < 20; i++)
{
printf("%d ", arr2[i]);
}
return 0;
}
9. memmove函数的模拟实现
void * memmove ( void * destination, const void * source, size_t num );
函数作用:内存拷贝
- 和
memcpy
的差别就是memmove
函数处理的源内存块和目标内存块是可以重叠的。 - 如果源空间和目标空间出现重叠,就得使用
memmove
函数处理
#include <stdio.h>
#include <string.h>
void* my_memmove(void* dest, const void* src, size_t num)
{
char* dest_t = (char*)dest;
const char* src_t = (const char*)src;
assert(dest && src);
if (src_t > dest_t || src_t + num <= dest_t)
{
while (num--)//正序复制
{
*dest_t++ = *src_t++;
}
}
else//逆序赋值
{
//调整指针到最后
dest_t += num - 1;
src_t += num - 1;
while (num--)
{
*dest_t-- = *src_t--;
}
}
return dest;
}
int main()
{
int arr[10] = { 1, 2, 3, 4, 5, 6, 7, 8, 9 };
//my_memcpy(arr + 2, arr, 16);//拷贝内存重叠
my_memmove(arr + 2, arr, 16);//将arr拷贝到arr+2位置,拷贝4个int型数据
int i = 0;
for (i = 0; i < 9; i++)
{
printf("%d ", arr[i]);
}
return 0;
}
以上。