文件I/O(不带缓冲)之lseek函数


每个打开的文件都有一个与其相关联的“当前文件偏移量”(current file offset)。它通常是一个非负整数,用以度量从文件开始处计算的字节数。通常,读、写操作都从当前文件偏移量处开始,并使偏移量增加所读写的字节数。

可以调用lseek显示地为一个打开的文件设置其偏移量:

#include <unistd.h> filedes, off_t offset,  whence );

返回值:若成功则返回新的文件偏移量,若出错则返回-1。

对参数offset的解释与参数whence的值有关。(。)

若whence是SEEK_SET,则将该文件的偏移量设置为距文件开始处offset个字节。

若whence是SEEK_CUR,则将该文件的偏移量设置为其当前位置加offset,offset可为正或负。

若whence是SEEK_END,则将新文件的偏移量设置为文件长度加上offset,offset可为正或负。

若lseek成功执行,则返回新的文件偏移量,为此可以用下列方式确定打开文件的当前偏移量:

= lseek( fd, , SEEK_CUR );

 

这种方法也可用来确定所涉及的文件是否可以设置偏移量。如果文件描述符引用的是一个管道、FIFO或网络套接字,则lseek返回-1,并将errno设置为ESPIPE。

三个符号常量SEEK_SET、SEEK_CUR和SEEK_END是由系统V引入的。在系统V之前,whence被指定为0(绝对偏移量)、1(相对于当前位置的偏移量)或2(相对于文件尾端的偏移量)。现在的很多软件仍然把这些数字直接写在代码里。

lseek中的字符l表示长整型。在引入off_t数据类型之前,offset参数和返回值是长整型。lseek是由V7引入的,当时C语言中增加的长整型(在V6中,用函数seek和tell提供类似的功能)。

程序清单3-1 测试能否对标准输入设置偏移量

[root@localhost apue]# cat prog3-

(lseek(STDIN_FILENO, , SEEK_CUR) == -

调用此程序,可得:

[root@localhost apue]# ./prog3- < /etc//prog3- < /etc/

关于/etc/motd和/etc/issue的问题可参考:http://itchen.blog.51cto.com/343363/206679

通常,文件的当前偏移量应当是一个非负整数,但是,某些设备也可能允许负的偏移量。但对于普通文件,则其偏移量必须是非负值。

在Intel x86处理器上运行的FreeBSD上的/dev/kmem设备支持负的偏移量。

因为偏移量(off_t)是带符号数据类型,所以文件最大长度会减少一半。例如,若off_t是32位整型,则文件最大长度是2^31-1个字节。

文件偏移量可以大于文件的当前长度,在这种情况下,对该文件的下一次写将加长该文件,并在文件中构成一个,这一点是允许的。位于文件中但没有写过的字节都被读为0。

。具体处理方式与文件系统的实现有关,当定位到超出文件尾端之后写时,对于新写的数据需要分配磁盘块,但是对于原文件尾端和新开始写位置之间的部分则不需要分配磁盘块。

程序清单3-2 创建一个具有空洞的文件

[root@localhost apue]# cat prog3-<fcntl.h>

 buf1[] =  buf2[] = ((fd = creat(, FILE_MODE)) < (write(fd, buf1, ) != 

        (lseek(fd, , SEEK_SET) == -

        (write(fd, buf2, ) != 

运行该程序得到:

[root@localhost apue]# ./prog3---rw-r--r--  root root  - :-   a   b   c   d   e   f   g   h   i   j  \  \  \  \  \  \
  \  \  \  \  \  \  \  \  \  \  \  \  \  \  \  \
*

使用。命令中的-c标志表示以字符方式打印文件内容。从中可以看到,文件中间的未写字节都被读成为0。每一行的开始的一个7位数是以八进制形式表示的字节偏移量。

因为lseek使用的偏移量是用off_t类型表示的,所以允许具体实现根据各自特定的平台自行选择大小合适的数据类型。现今大多数平台提供两组接口以处理文件偏移量:一组使用32位文件偏移量,另一组则使用64位文件偏移量。

注意:尽管可以支持64位文件偏移量,但是否能创建一个大于2GB(2^31-1个字节)的文件则依赖于底层文件系统的类型。

相关内容