底层文件访问
open系统调用
#include <fcntl.h> #include <sys/types.h>
#include <sys/stat.h> int open(const char *path, int oflags);
int open(const char *path, int oflags, mode_t mode);
在遵循POSIX规范的系统上,使用open系统调用并不需要包含头文件sys/types.h和sys/stat.h,但在某些UNIX系统上,他们可能必不可少。
open系统调用建立了一条从到文件或设备的访问路径,该调用将得到与该文件相关联的文件描述符(file discriptor)
任何一个进程可以同时打开的文件数目有限,通常由limits.h头文件中的常量OPEN_MAX定义,该值与系统有关,且这个限制本身还受到系统全局性限制影响,所以一个程序未必总是可以打开这么多文件。在Linux系统中,这个限制可以随着系统运行而调整,所以OPEN_MAX并不是一个常量。它通常一开始就被设置未256
参数 | 解释 |
---|---|
path | 准备打开的文件或者设备的名字 |
oflags | 打开文件所采取的动作 |
mode | 文件访问模式 |
oflag参数包括下列值的组合(用“按位与”操作)
值 | 解释 |
---|---|
O_APPEND | 把写入数据追加到文件末尾 |
O_TRUNC | 把文件长度设置为0,丢弃已有内容 |
O_CREAT | 如需要就按参数mode给出的访问模式创建文件 |
O_EXCL | 与O_CREAT一起使用,确保调用者创建出文件。open调用是一个原子操作,它只执行一个函数调用。使用这个可选模式可以防止两个程序同时创建一同一个文件。如果文件已经存在,open调用失败 |
当你使用带有O_CREAT标志的open调用时,你必须使用带3个有参数的open调用。第3个参数mode是几个标志位按位或后得到的,这些标志在头文件sys/stat.h中定义
值 | 权限 | 拥有者 |
---|---|---|
S_IRUSR | r | user |
S_IWUSR | w | user |
S_IXUSR | x | user |
S_IRGRP | r | group |
S_IWGRP | w | group |
S_IXGRP | x | group |
S_IROTH | r | other |
S_IWOTH | w | other |
S_IXOTH | x | other |
用户掩码(由umask命令设定)会影响被创建文件的访问权限open调用中参数mode的值与当前用户掩码的反值做与操作
write系统调用
#include <stdio.h>
size_t write(int fd, const void *buf, size_t nbytes);
write系统调用把缓冲区buf中的前n个bytes写入与文件描述符fd相关的文件中。
参数 | 解释 |
---|---|
fd | 数据目的地的文件描述符 |
buf | 数据来源地的指针 |
nbytes | 写入数据字节数 |
返回实际写入的字节数,返回值可能小于nbytes。如果返回0,表示未写入数据;如果返回-1,表示write调用出错,错误代码保存在全局变量errno中。
read系统调用
#include <unistd.h>
size_t read(int fd, void *buf, size_t nbytes);
read系统调用从与文件描述符fd相关联的文件中读入nbytes字节的数据,并把它们放到buf中。
参数 | 解释 |
---|---|
fd | 数据来源文件的文件描述符 |
buf | 数据目的地指针 |
nbytes | 读入数据字节数 |
返回实际读入的字节数,可能会小于nbytes。如果返回0,表示未读入任何数据,已到达文件尾;返回-1表示出现错误。
close系统调用
#include <unistd.h>
int close(int fd);
close调用终止文件描述符fd与其对应文件之间的关联。文件描述符被释放并能够重新使用。close调用成功时候返回0,出错时返回-1。
检查close调用的返回结果非常重要。有的文件系统,特别使网络文件系统,可能不会在关闭文件之前报告文件写操作中出现的错误,这是因为在执行写操作时,数据可能未被确认写入
lseek系统调用
#include <unistd.h>
#include <sys/types.h>
off_t lseek(int fd, off_t offset, int whence);
lseek系统调用对文件描述符的读写指针位置进行设置> 参数whence定义该偏移量offset的用法,可取下列值
| 参数 | 解释 |
| ------------- |:-------------:|
|SEEK_SET|绝对位置|
|SEEK_CUR|相对于当前位置|
|SEEK_END|相对于文件尾|
fstat stat lstat系统调用
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
int fstat(int fd, struct stat *buf);
int stat(const char *path, struct stat *buf);
int lstat(const char *paht, struct stat *buf);
fstat系列调用返回与打开的文件描述符相关联的文件的状态信息,该信息将被写入buf中
stat和lstat返回的使通过文件名查询到的状态信息。它们产生相同效果,但当文件是符号链接时,lstat返回的是该符号链接本身的信息,而stat返回的使该链接指向文件的信息。
标准IO库
在标准IO库中,与底层文件描述符对应的流(stream),它被实现为指向结构体FILE的指针(FILE )> 在启动程序时,有三个文件流被自动打开的。它们是stdin stdout stderr他们与底层文件描述符0 1 2相对应,分别代表标准输入 标准输出 标准错误输出IO函数可能存在缓冲区安全问题,应该避免使用这样的函数,或者十分谨慎地使用有安全问题的函数*
fopen函数
#include <stdio.h>
FILE *fopen(const char *filename, const char *mode);
fopen打开由参数filename指定的文件,并把它与一个文件流关联起来。> > 参数mode指定文件的打开方式,取下列字符串中的值。
参数 | 解释 | |||
---|---|---|---|---|
"rb" or "rb" | 只读 | |||
"w" or "wb" | 写方式,并把文件长度截短为0 | "a" or "ab" | 写方式,新内容追加到文件尾 | |
"r+" or "rb+" | 读写 | |||
"w+" or "wb+" | 读写,文件长度截短为0 | |||
"a+" or "ab+" | 读写,新内容追加在文件尾 |
字母b表示文件是一个二进制(binary)文件fopen调用成功将会返回一个非空的FILE指针,失败时返回NULLunix和Linux把所有文件都看成二进制文件,参数mode必须是字符串,所以总是应该使用双引号,而不是单引号*
可用的文件流数量也是有限的。实际限制由头文件stdio.h中的FOPEN_MAX定义,它的值至少为8,在linux系统中通常是16。
fread函数
#include <stdio.h>
size_t fread(void *ptr, size_t size, size_t nitems, FILE *stream);
数据从文件流stream读到ptr指向的数据缓冲区中。fread和fwrite都是对数据记录进行操作,size参数指定每个数据记录的长度,计数器ntimes给出要传输的记录个数。
返回值是成功读到数据缓冲区里的记录个数(不是字节数)。当到达文件尾,它的返回值可能会小于ntimes,甚至可以是0。
fwrite函数
#include<stdio.h>
size_t fwrite(const void *ptr, size_t size, size_t nitems, FILE *stream);
fwrite与fread有相似的接口。它从指定的数据缓冲区取出数据记录,并把它们写到文件流stream中。
返回值是成功写入的记录个数
fclose函数
#include <stdio.h>
int fclose(FILE *stream);
fclose函数关闭指定的文件流stream,使所有尚未写出的数据写出。如果要确保数据已经全部写出,就应该调用fclose函数。当程序正常结束时,会自动对所有还打开的文件流调用fclose函数。
fflush函数
#include <stdio.h>
int fflush(FILE *stream);
将文件流里所有尚未写出的数据立刻写出。有时在调试程序时,可以用它来确认程序正在写数据而不是被挂起了。调用fclose函数隐含执行了一次flush操作
fseek函数
fseek函数与lseek函数系统调用对应的文件流函数。它在文件流里为下次读写操作指定位置。offset和whence参数的含义和取值与前面的lseek系统调用完全一样。但是fseek返回一个证书:0表示成功,-1表示失败并设置errno支出错误。
fgetc getc getchar函数
#include <stdio.h>
int fgetc(FILE *stream);
int getc(FILE *stream); int getchar();
fgetc函数从文件流stream取出下一个字节并把它作为一个字符返回。当它到达文件尾或者出现错误时,它返回EOF(end of file)。可以通过ferror或者feof来区分> getc的作用和fgetc相同,但是它有可能被实现为一个宏(macro),如果这样,stream参数就可能被计算不止一次,所以它不能有副作用。此外,不能保证能够使用getc的地址作为函数指针
getchar函数相当于getc(stdin),它从标准输入里读取下一个字符。
fputc putc putchar函数
#include<stdio.h>
int fputc(int c, FILE *stream);
int putc(int c, FILE *stream);
int putchar(int c);
fputc函数把字符c写到文件流stream中。它返回写入的值,如果失败则返回EOF.> putc函数作用相当于fputc,但它可能被实现为一个宏。
putchar函数相当于putc(c, stdout),它把单个字符写到标准输出。注意,putchar和getchard都是把字符当做int类型而不是插入类型。这就允许文件尾(EOF)取值-1,这是一个超出字符数字编码范围的值。
fgets gets函数
#include <stdio.h>
char *fgets(char *s, int n, FILE *stream);
char *gets(char *s);
fgets函数把读到的字符写到s指向的字符串里,知道出现下列情况:
- 遇到换行符
- 已经传输了n-1个字符
- 到达文件尾
它会把遇到的换行符也传递到接收字符串,再加上一个表示结尾的空字符\0。
当调用成功时,fgets返回一个指向字符串s的指针。如果文件流已经到达文件尾,fgets会设置这个文件流的EOF标志并返回一个空指针。如果出现读错误,fgets返回一个空指针并设置errno。
gets函数类似于fgets函数,但gets函数存在缓冲区溢出问题,不推荐使用
格式化输入和输出
printf fprintf sprintf snprintf函数
#include <stdio.h>
int printf(const char *format, ...);
int sprintf(char *s, const char *format, ...);
int fprintf(FILE *stream, const char *format, ...);
int snprintf(char *s, size_t size, const char *format, ...);
snprintf修复了缓冲区问题,推荐使用
snprintf将可变个参数(...)按照format格式化成字符串,然后将其复制到str中(1) 如果格式化后的字符串长度 < size,则将此字符串全部复制到str中,并给其后添加一个字符串结束符('\0');
(2) 如果格式化后的字符串长度 >= size,则只将其中的(size-1)个字符复制到str中,并给其后添加一个字符串结束符('\0')返回值为欲写入的字符串长度。
常见格式控制符:
控制符 | 解释 |
---|---|
%d, %i | 十进制格式输出整数 |
%o, %x | 八进制或十六进制格式输出一个整数 |
%c | 输出一个字符 |
%s | 输出字符串 |
%f | 单精度浮点数 |
%e | 科学计数法格式输出双精度浮点数 |
%g | 以通用格式输出一个双精度浮点数 |
-------#### scanf fscanf sscanf函数
#include <stdio.h> int scanf(const char *format, ...);
int fscanf(FILE *stream, const char *format, ...);
int sscanf(const char *s, const char *format, ...);
scanf系列函数实现有漏洞,使用不够灵活,不推荐使用
错误处理
本文中的许多函数和系统调用都可能失败。它们会在失败时候设置外部变量errno来指明失败原因
#include <errno.h>
extern int errno;
你必须在函数调用失败之后立刻对其进行检查,你总是应该在使用它之前将它复制到另一个变量,因为它的值可能被下一个函数调用覆盖,即使下一个函数并没有出错,也可能会覆盖这个变量
错误代码 | 解释 |
---|---|
EPERM | 操作不允许 |
ENOENT | 文件或目录不存在 |
EINTR | 系统调用被中断 |
EIO | IO错误 |
EBUSY | 设备或资源忙碌 |
EEXIST | 文件存在 |
EINVAL | 无效参数 |
EMFILE | 打开文件过多 |
ENODEV | 设备不存在 |
EISDIR | 是一个目录 |
ENOTDIR | 不是一个目录 |
以上错误代码均保存在头文件errno.h中
#include<stdio.h> int ferror(FILE *stream);
int feof(FILE *stream);
void clearerr(FILE *stream);
ferror函数测试文件流stream的错误标识,如果该标识被设置就返回一个非0值,否则返回0
feof函数测试一个文件流的文件尾标识,如果该标识被设置就返回非0值,否则返回0。
clearerror函数的作用是清除由stream指向的文件流的文件尾标识和错误标识。它无返回值,也未定义任何错误。
#include <string.h> char *strerror(int errnum);
strerror函数把错误代码映射成一个字符串,该字符串对错误代码进行解释。
#include <stdio.h> void perror(const char *s);
perror函数把errno变量中的当前错误映射成一个字符串,并把它输出到标准错误输出流(stderr)。该字符串的前面加上字符串s(如果不为空),再加上一个冒号和空格。
void *指针类型
void即“无类型”,void *则为“无类型指针”,可以指向任何数据类型。反之则不然,例如:
void *p;
int *a;
p = a; //合法
a = p; //不合法
a = (int *) p; //合法
如果函数的参数可以是任意类型指针,那么应声明其参数为void*。例如内存操作函数:
void * memcpy(void *dest,const void *src,size_t len);
从源src所指的内存地址的起始位置开始拷贝n个字节到目标dest所指的内存地址的起始位置中。返回指向dest
void * memset(void *buffer,int c,size_t num);
将buffer中前n个字节用c替换并返回buffer 。