很多的时候,在应用层中会做一些文件的cache ,那么绕开linux vfs提高读写文件的性能就显的比较重要,由于Direct IO 中操作文件有buffer地址和大小 页对齐, 那么在copy file 的时候,用direct IO,就会碰到如果文件大小不是页的整数倍的时候,最后一块 block是无法copy的,系统返回-EINVAL。
主要是在文件 direct_io.c 中的函数__blockdev_direct_IO()
- if ((addr & blocksize_mask) || (size & blocksize_mask)) {
- if (bdev)
- blkbits = bdev_blkbits;
- blocksize_mask = (1 << blkbits) – 1;
- if ((addr & blocksize_mask) || (size & blocksize_mask))
- goto out;
- }
一种方法就是把最后一个长度不是和bocksize_mask对齐的buffer直接append到文件的末尾,由于文件的指针刚好在文件的最后,所以可以直接append,但绕不开page cache,会产生页碎片的问题。
还有一种方法,就是不需要direct IO 复制文件,只要在copy结束的时候调用
fdatasync(file);
posix_fadvise(file, 0, 0, POSIX_FADV_DONTNEED);
清除page cache,但有性能影响,不过你当然可以异步去清除page cache.