实际案例
- 在访问某些二进制文件时,希望能把文件映射到内存中,可以实现随机访问(如 framebuffer设备文件);
- 某些嵌入式设备,寄存器被编址到内存地址空间,我们可以映射/dev/mem某范围,去访问这些寄存器;
- 如果多个进程映射同一个文件,还能实现进程通信的目的。
解决方案:使用标准库中mmap模块的mmap()函数,它需要一个打开的文件描述符作为参数。
注:本案例在Linux系统下实验。
在shell下,我们通过dd命令创建了一个数据全为0且大小为1M的二进制文件,通过od -x命令以十六进制的方式查看该文件。
rookie@rookie ~/Desktop $ dd if=/dev/zero of=demo.bin bs=1024 count=1024
1024+0 records in
1024+0 records out
1048576 bytes (1.0 MB, 1.0 MiB) copied, 0.007549 s, 139 MB/s
rookie@rookie ~/Desktop $ od -x demo.bin
0000000 0000 0000 0000 0000 0000 0000 0000 0000
*
4000000
我们在shell中键入如下命令将二进制文件映射到内存:
>>> f = open('demo.bin', 'r+b')
>>> import mmap
>>> m = mmap.mmap(f.fileno(), 0, access=mmap.ACCESS_WRITE)
>>> type(m)
<type 'mmap.mmap'>
>>> m[0]
'\x00'
>>> m[10:20]
'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00'
>>> m[0] = '\x88'
rookie@rookie ~/Desktop $ od -x demo.bin
0000000 0088 0000 0000 0000 0000 0000 0000 0000
0000020 0000 0000 0000 0000 0000 0000 0000 0000
*
4000000
上述命令中,我们使用Python内置的open()函数来得到文件描述符,并使用f.fileno()来获取文件描述符。除此之外,我们也可使用os模块下的open()函数来得到文件描述符。mmap()函数的第二个参数0表示将整个文件映射到内存,第三个参数mmap.ACCESS_WRITE表示获取写权限。
通过调用mmap()函数,我们可以得到mmap的对象m。我们可以利用这个对象m进行类似列表一样的操作。
注:在mmap()函数中还有一个offset参数,其表示指定映射文件的某个区域,但其必须是内存页大小的整数倍。
>>> m = mmap.mmap(f.fileno(), mmap.PAGESIZE*8, access=mmap.ACCESS_WRITE, offset=mmap.PAGESIZE*4)
>>> m[:0x1000] = '\xaa' * 0x1000
rookie@rookie ~/Desktop $ od -x demo.bin
0000000 0088 0000 0000 0000 0000 0000 0000 0000
0000020 0000 0000 0000 0000 0000 0000 0000 0000
*
0040000 aaaa aaaa aaaa aaaa aaaa aaaa aaaa aaaa
*
0050000 0000 0000 0000 0000 0000 0000 0000 0000
*
4000000
通过上述操作,我们在内存中修改数据的同时也将文件的数据给修改了。因此,我们达到了将文件映射到内存的目的。
注:本部分内容本人也是有点囫囵吞枣,希望路过的大佬能够指点迷津,谢谢!