老三样,学习一个新概念之前,先提出三个问题:
- 它是啥
- 它干哈用的
- 咋用啊这玩意
文件描述符的概念
文件描述符在形式上是一个非负整数。实际上,它是一个索引值,指向内核为每一个进程所维护的该进程打开的文件的记录表。当程序打开一个文件时,内核向进程返回一个文件描述符。
哈哈哈哈,懵不懵?这玩意你们能看懂吗?这是维基百科里的标准解释。
再了解文件描述符的概念之前,咱们先了解下应用程序访问系统文件的流程。
文件是存储在磁盘里的,磁盘是PC硬件,应用程序想要访问硬件系统是不能直接访问的,必须发起系统调用,由系统内核来发起调用读写文件。
现代操作系统,将内存划分为两个部分,一个是用户空间,另一个是内核空间。应用程序在用户空间内运行,系统内核在内核空间中运行。用户空间的应用程序没有权限直接访问硬件资源,但是系统内核可以,比如读写文件、读写网卡。用户程序想要访问硬件资源,必须发起系统调用(system call)。内核收到系统调用后,执行并将结果返回给应用程序。
一个用户程序读取硬盘文件的流程如下:
上面简单介绍了用户空间和内核空间,这对于理解fd有很大帮助。 fd的存在,就是因为用户程序无法直接访问硬件,因此当应用程序发起系统调用打开一个文件后,必须有一个东西标识着这个文件,这个标识就是fd。
三张表
file descriptors: 由用户程序维护的记录表,记录的是该用户程序打开的所有的文件的fd。每个进程会预留三个默认的fd:stdin(0)、 stdout(1)、stderr(2)。
file table:该表是全局唯一的,由系统内核维护,记录了所有进程打开的文件的状态、偏移量、访问模式(可读写)、文件类型、该文件对应的inode对象引用等
Inode table: 全局唯一的表,是硬盘存储的文件的元数据的集合
如果不清楚Inode Table是啥,可以看下之前的这篇文章:彻底搞懂硬链接和软链接
三张表的映射关系如上图。
结合这三张表,应用程序读一个硬盘文件的流程如下:
*当用户程序需要读写一个硬盘文件时, 首先调用Open()方法打开文件,此时会发起系统调用;
*内核收到调用请求会根据文件名找到对应文件的inode编码,然后根据inode编码去inode table找到对应编码的inode元数据;
*然后内核会根据元数据信息创建一个包含文件信息的entry插入到file table中,并向应用程序返回file descriptor;
*应用程序将fd插入到file descriptors表中,到此时应用程序拿到了该文件的fd;
*当应用程序read()时,发起系统调用,将fd传给内核;
*内核根据fd以及这三张表的映射关系,找到对应的inode元数据;
*内核根据元数据信息向磁盘发起读取请求,将数据写入内核缓冲区(内核空间);
*内核将内核缓冲区的数据复制到用户进程的用户缓冲区(用户空间);
回答最开始提出的三个问题:
fd是啥?
fd是系统维护的file table表的某一项entry的指针,应用程序通过它能读写硬盘里文件。
fd有啥用?
应用程序用它来跟内核打交道,让内核以fd定位应用程序所需访问的文件并帮忙读写数据
fd 咋用?
程序员绝大多数情况下不会直接使用它,系统底层已经帮我们封装好了接口,我们只需要调用类似Open()、Read()、Write()等接口方法就可以了。