文件:用户数据 (user data) 与元数据 (metadata)
我们知道文件都有文件名与数据,这在 Linux 上被分成两个部分:用户数据 (user data) 与元数据 (metadata)。用户数据,即文件数据块 (data block),数据块是记录文件真实内容的地方;而元数据则是文件的附加属性,如文件大小、创建时间、所有者等信息。在 Linux 中,元数据中的 inode 号(inode 是文件元数据的一部分但其并不包含文件名,inode 号即索引节点号)才是文件的唯一标识而非文件名。文件名仅是为了方便人们的记忆和使用,系统或程序通过 inode 号寻找正确的文件数据块。
链接
为解决文件的共享使用,Linux 系统引入了两种链接:硬链接 (hard link) 与软链接(又称符号链接,即 soft link 或 symbolic link)。链接为 Linux 系统解决了文件的共享使用,还带来了隐藏文件路径、增加权限安全及节省存储等好处。
-
硬链接
若一个 inode 号对应多个文件名,则称这些文件为硬链接。换言之,硬链接就是同一个文件使用了多个别名。硬链接可由命令 link 或 ln 创建(~>link oldfile newfile
或者~>ln oldfile newfile
)。
由于硬链接是有着相同 inode 号仅文件名不同的文件,因此硬链接存在以下几点特性:
1.文件有相同的 inode 及 data block;
2.只能对已存在的文件进行创建;
3.不能交叉文件系统进行硬链接的创建;
4.不能对目录进行创建,只可对文件创建;
5.删除一个硬链接文件并不影响其他有相同 inode 号的文件。 -
软链接
软链接与硬链接不同,若文件用户数据块中存放的内容是另一文件的路径名的指向,则该文件就是软连接。软链接就是一个普通文件,只是数据块内容有点特殊。软链接有着自己的 inode 号以及用户数据块。因此软链接的创建与使用没有类似硬链接的诸多限制:
1.软链接有自己的文件属性及权限等;
2.可对不存在的文件或目录创建软链接;
3.软链接可交叉文件系统;
4.软链接可对文件或目录创建;
5.创建软链接时,链接计数 i_nlink 不会增加;
6.删除软链接并不影响被指向的文件,但若被指向的原文件被删除,则相关软连接被称为死链接(即 dangling link,若被指向路径文件被重新创建,死链接可恢复为正常的软链接)。
僵尸进程和孤儿进程
- 孤儿进程:一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程。孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作。
- 僵尸进程:一个进程使用fork创建子进程。如果子进程退出,而父进程并没有调用wait或waitpid获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵尸进程。
-
危害
孤儿进程被init进程收养,孤儿进程并不会有什么危害。
unix提供了一种机制可以保证只要父进程想知道子进程结束时的状态信息, 就可以得到。这种机制就是: 在每个进程退出的时候,内核释放该进程所有的资源,包括打开的文件,占用的内存等。 但是仍然为其保留一定的信息,包括
1.进程号(the process ID)
2.退出状态(the termination status of the process)
3.运行时间(the amount of CPU time taken by the process)等
僵尸进程危害:直到父进程通过wait/waitpid来取时才释放。但这样就导致了问题,如果进程不调用wait/waitpid的话,那么保留的那段信息就不会释放,其进程号就会一直被占用,但是系统所能使用的进程号是有限的,如果大量的产生僵死进程,将因为没有可用的进程号而导致系统不能产生新的进程。 此即为僵尸进程的危害,应当避免。 -
如何避免僵尸进程
1.调用wait(只能处理一个进程)或者waitpid函数查询子进程退出状态,此方法父进程会被挂起(不能做其他事情)。
2.如果不想让父进程挂起,可以在父进程中加入一条语句:signal(SIGCHLD,SIG_IGN);表示父进程忽略SIGCHLD信号,该信号是子进程退出的时候向父进程发送的,子进程结束后,内核会回收。
wait与waitpid区别:
1.在一个子进程终止前, wait 使其调用者阻塞,而waitpid 有一选择项,可使调用者不阻塞。
2.waitpid并不等待第一个终止的子进程—它有若干个选择项,可以控制它所等待的特定进程。
3.实际上wait函数是waitpid函数的一个特例。waitpid(-1, &status, 0);