当前位置:首页 » 《随便一记》 » 正文

【Linux】基础IO—1

5 人参与  2024年04月20日 09:25  分类 : 《随便一记》  评论

点击全文阅读


提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

目录

文章目录

前言

先来段代码回顾C文件接口

"w"写文件

"a"追加文件

"r"读文件

输出信息到显示器,你有哪些方法

stdin & stdout & stderr

提炼一下对文件的理解(第一阶段)

理解文件并采用系统调用接口来访问文件

总结



前言

世上有两种耀眼的光芒,一种是正在升起的太阳,一种是正在努力学习编程的你!一个爱学编程的人。各位看官,我衷心的希望这篇博客能对你们有所帮助,同时也希望各位看官能对我的文章给与点评,希望我们能够携手共同促进进步,在编程的道路上越走越远!


提示:以下是本篇文章正文内容,下面案例可供参考

先来段代码回顾C文件接口

"w"写文件

#include <stdio.h>#include <string.h>int main(){FILE* fp = fopen("myfile", "w");if (!fp) {printf("fopen error!\n");}const char* msg = "hello bit!\n";int count = 5;while (count--) {fwrite(msg, strlen(msg), 1, fp);}fclose(fp);return 0;}

我们要进行文件操作,前提是我们的程序跑起来。文件的打开和关闭,是CPU在执行我们的代码。

以“w”的方式打开文件:

1、如果文件不存在,就在当前路径下,新建指定的文件;

2、默认打开文件的时候,就会先把目标文件清空。

echo "hello bite" > log.txt

>(输出重定向):

1、文件不存在,就新建文件;

2、打开文件,先清空,再写入

>>(追加重定向):

不会清空文件,会在文件内容后面添加内容

"a"追加文件

#include <stdio.h>int main(){    // 系统怎么知道当前创建的log.txt文件在这个路径下呢?    // 因为我们在运行文件操作的时候,执行我们所写的代码,执行的时候,就已经变成了一个进程了,    // 所以,我们建立log.txt文件时,默认会结合我们当前进程所在路径,拼上我们的log.txt,创建log.txt文件。    // 我们进程在启动时,所处的路径,叫做当前进程的当前工作路径。    FILE* fp = fopen("log.txt", "a");    if (NULL == fp)    {        perror("fopen");        return 1;    }    fprintf(fp, "helloworld, %d, %s, %lf\n", 10, "whb", 3.14);    fclose(fp);    return 0;}

"r"读文件

#include <stdio.h>#include <string.h>int main(){    FILE* fp = fopen("myfile", "r");    if (!fp) {        printf("fopen error!\n");    }    char buf[1024];    const char* msg = "hello bit!\n";    while (1)    {        //注意返回值和参数,此处有坑,仔细查看man手册关于该函数的说明        ssize_t s = fread(buf, 1, strlen(msg), fp);        if (s > 0) {            buf[s] = 0;            printf("%s", buf);        }        if (feof(fp)) {            break;        }    }    fclose(fp);    return 0;}

输出信息到显示器,你有哪些方法

#include <stdio.h>#include <string.h>int main(){    const char* msg = "hello fwrite\n";    fwrite(msg, strlen(msg), 1, stdout);    printf("hello printf\n");    fprintf(stdout, "hello fprintf\n");    return 0;}
int fprintf(FILE *stream,const char *format,...)// 向显示器当中进行打印,把指定的内容按照指定的格式,写到特定的文件当中

stdin & stdout & stderr

C默认会打开三个输入输出流,分别是stdin(键盘), stdout(显示器), stderr(显示器)仔细观察发现,这三个流的类型都是FILE*, fopen返回值类型,文件指针

文件操作详解

提炼一下对文件的理解(第一阶段)

打开文件:本质其实是进程(struct task_struct)打开文件(struct file)!!!

文件没有被打开的时候,在哪里?在磁盘当中。

进程能打开很多文件吗?可以。

系统当中可不可以存在很多进程呢?可以。

很多清空下,OS内部,一定存在大量的被打开的文件。

那么OS要不要把这些被打开的文件进行管理呢?答案是要的。先描述,再组织!所以每一个被打开的文件,在OS内部,一定要存在对应的描述文件属性的结构体。类似PCB。

每一个语言对文件的操作方法都是不一样的。

理解文件并采用系统调用接口来访问文件

a、操作文件,本质:进程在操作文件。进程的文件的关系。

b、文件 -> 磁盘 -> 外设 -> 硬件 -> 向文件中写入,本质是向硬件中写入 -> 用户没有权利直接在硬件内写入 -> OS是硬件的管理者 -> 通过OS写入 -> OS必须给我们提供系统调用接口(OS不相信任何人) -> 我们用的C/C++/...中操作文件的方法,都是对系统调用接口的封装!

操作文件,除了上述C接口(当然,C++也有接口,其他语言也有),我们还可以采用系统接口来进行文件访问, 先来直接以代码的形式,实现和上面一模一样的代码:

 系统调用的文件操作 man 2 open  2号手册,系统调用 open()函数:打开文件 #include <sys/types.h> #include <sys/stat.h> #include <fcntl.h>  int open(const char *pathname,int flags);  // 一般是操作已经存在的文件 int open(const char *pathname,int flags,mode_t mode); 第一个参数:打开的文件是谁,可以带路径,也可以直接写文件名;如果只有文件名,就在当前的路径下创建文件; 第二个参数:想要怎么创建这个文件,flags是一个整数,但是flags可以传递很多标记位; 第二个参数:flags是一个整数,是32个比特位。用比特位来进行标记位的传递。 ---- OS设计很多系统调用接口的常见方法  本质:位图 第三个参数:文件的起始权限 返回值:是一个整数,文件描述符;失败:返回-1,错误码被设置
 man 2 close #include <unistd.h> int close(int fd); 参数:open()函数返回的整数
 man 2 write  向文件当中写入 #include <unistd.h> ssize_t write(int fd,const void *buf,size_t count);// 把指定的缓冲区写入指定的文件里 第二个参数:指定一个缓冲区,缓冲区的起始地址 第三个参数:缓冲区的大小

操作系统为每一个被打开的文件,都创建了内核数据结构(struct file),用于文件的描述,包含了文件的属性;struct file内部中会包含了两个个指针,一个指针会指向我们在系统当中对应的一段与该文件所对应的,叫做文件内核级的缓存(其实就是OS给我们申请的一块内存);另一个指针,指向的是操作底层方法的指针表(比如:一些硬件设备的操作方法)。

文件 = 属性 + 内容

属性初始化 struct file    文件内容写到缓存里:日后读、写就在缓存里进行,然后再把数据刷新到磁盘里。

所以,每一个文件都要有一个:文件内核级的缓存
最终我们对OS内的文件的管理,转化成了对 struct file的内核数据结构的管理。
进程task_struct里有一个指针:struct files_struct *files,这个指针指向的是struct files_struct空间,空间里有一个指针数组(struct file *fd array[N]),这个指针数组中的每一个元素都是被打开文件的地址,而指针数组的下标是fd(文件描述符)。

操作系统只认文件描述符fd,只要拿到了fd就可以对文件进行操作。

无论读写,都必须在合适的时候,让OS把文件的内容读到文件缓存区中。write、read函数,本质都是在拷贝数据。

open()在干什么呢?

1、创建file;

2、开辟文件缓冲区的空间,加载文件数据(延后);

3、查进程的文件描述符表;

4、file地址,填入对应的文件描述符表下标中;

5、返回下标。

#include <stdio.h>#include <string.h>#include <unistd.h>#include <sys/types.h>#include <sys/stat.h>#include <fcntl.h>int main(){    const char* message = "hello Linux file!\n";    // 可以直接向“1”里面打印内容,“1”就是标准输出流    write(1, message, strlen(message));    // C语言的方式向标准输出流里打印内容    fprintf(stdout, "hello: %d\n", 10);// 第一个参数是stdout的话,和printf()函数的结果一样    fflush(stdout);// 刷新数据    // 0:标准输入(键盘)  1:标准输出(显示器)  2:标准输出(显示器)     // 0、1、2已经被占用了,所以open()函数的返回值从3开始    int fda = open("loga.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);    printf("fda: %d\n", fda);// 3    int fdb = open("logb.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);    printf("fdb: %d\n", fdb);// 4    int fdc = open("logc.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);    printf("fdc: %d\n", fdc);// 5    int fdd = open("logd.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);    printf("fdd: %d\n", fdd);// 6    umask(0);// 权限掩码设置为0  就近原则:有设置的掩码,就用设置的;没有,就用系统的    // system call    // O_WRONLY:以只写的方式打开    O:代表open的意思    // O_CREAT:如果文件不存在,创建这个文件    // O_TRUNC:清空文件内容    // O_APPEND:打开文件,用追加模式    // 0666:文件的起始权限,起始权限也会和umask权限掩码处理,所以,不一定是0666的权限    int fd = open("log.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);    int fd = open("log.txt", O_WRONLY | O_CREAT | O_APPEND, 0666);    // open()系统调用接口,以写的方式打开,默认不清空文件内容,下次写入文件是以覆盖式的写入内容    if(fd < 0)    {        perror("open");        return 1;    }    const char *message = "hello Linux file!\n";    //const char *message = "abcdefg\n";    //const char *message = "123";    write(fd, message, strlen(message));// C语言中有'\0',而Linux中没有'\0'的规则    close(fd);    return 0;}

O_RDONLY: 只读打开

O_WRONLY: 只写打开

O_RDWR : 读,写打开 这三个常量,必须指定一个且只能指定一个

O_CREAT : 若文件不存在,则创建它。需要使用mode选项,来指明新文件的访问权限 O_APPEND: 追加写

 怎么理解write(1, message, strlen(message))向一个整数里写,就相当于在一个文件里写呢?
 文件描述符fd,fd的本质是:内核的进程和文件映射关系的数组的下标。

 man 2 umask  //2号手册的权限掩码 #include <sys/types.h> #include <sys/stat.h> mode_t umask(mode_t mask);//在程序运行时,动态的设置权限的掩码

我们这样讲可能还会有些抽象,我们直接找到原码来看一下这些结构体之间的关系:

而现在知道,文件描述符就是从0开始的小整数。当我们打开文件时,操作系统在内存中要创建相应的数据结构来 描述目标文件。于是就有了file结构体。表示一个已经打开的文件对象。而进程执行open系统调用,所以必须让进 程和文件关联起来。每个进程都有一个指针*files, 指向一张表files_struct,该表最重要的部分就是包涵一个指针数 组,每个元素都是一个指向打开文件的指针!所以,本质上,文件描述符就是该数组的下标。所以,只要拿着文件 描述符,就可以找到对应的文件。

我们要对文件进行操作,我们可以用系统调用,也可以用语言提供的文件方法,但是最好还是用语言提供的文件方法。为什么呢?

因为系统不同,系统调用接口可能不一样,系统调用的方法不具有跨平台性。

语言为什么具有跨平台性?
比如:C语言文件的操作函数,底层都是用系统调用接口实现的,而不同的操作平台,系统调用接口可能不一样,就比如:C语言中的fopen()函数就使用不同的OS(windows、maxos、Linux)的系统调用接口实现fopen()函数,那么在编译的时候,不同的OS会生成不同的标准库,当然这些标准库,也都是C标准库,我们每再一个平台下,都需要下载对应平台的标准库,它们标准库中实现的函数都叫fopen(),所以C语言具有跨平台性。

我有一个显示器,但是可以有很多终端。

ls /lib64/libc.so //C语言的动态库(文件)

文件描述符的分配规则:在files_struct数组当中,找到当前没有被使用的 最小的一个下标,作为新的文件描述符。


总结

好了,本篇博客到这里就结束了,如果有更好的观点,请及时留言,我会认真观看并学习。
不积硅步,无以至千里;不积小流,无以成江海。


点击全文阅读


本文链接:http://zhangshiyu.com/post/97846.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1