A Fast File System for Unix

A Fast File System for Unix

0x00 引言

Unix FFS是针对HHD的经典文件系统设计,文章发表于1984了,距今已有34年了(比我年龄大上好多)。这篇论文在大三的时候就看过了。FFS的论文里面的思想影响到了现在很多文件系统的设计。

0x01 原有解决方案存在的问题

​ 经典的Unix文件系统布局:

Super Block
  |      |         |                           |
  |      |         |         Data              |
  |      | inodes  |                           |


How can we organize file system data structures so as to improve per- formance? What types of allocation policies do we need on top of those data structures? How do we make the file system “disk aware”?

0x02 基本思路


关键思路 01: The Cylinder Group



​ [2]中的这一幅图很好的表达了这种思想。值得注意的是现在的磁盘已经获取不到相关的物理信息了,所以现在的一些FS使用的方法是将磁盘分为block group,每一个group是在磁盘上是连续的。

|                    |                   |                      |
|      Group 0       |     Group 1       |    Group 2           |
|                    |                   |                      |


Super Block
    |       |         |            |                                |
    |       |         |    inodes  |         data                   |
    |       |         |            |                                |
            inode bitmap
                data bitmap

Super Block包含了文件系统的基本元数据信息,inode bitmap, data bitmap用于指示后面的indoes,data哪些部分被使用了。后面的两个部分用途和之前系统的一样(这里bitmap,inodes是预先就分配好的,在1984年的时候磁盘比较小,分配死的没有什么问题,后来的磁盘越来越多,现在的很多文件系统针对这个方面有了很多的优化)。这里的要按照cylinder group来方便分配。



  1. 分配一个新的inode;
  2. 在inode bitmap中表示这个inode被分配了;
  3. 分配一个数据块(假如一个就可以了),这样的话需要写data部分;
  4. 在data bitmap中标示对应的数据块被分配;
  5. 这还没有完,文件系统是存在目录结构的,所以对应的目录的元数据也要修改;

关键思路 02: 把相关的东西放一起


  • 对于目录: 查找有最少数量的目录和最多空闲inodes的cylinder,将目录的inode和数据放在这里。
  • 对于文件: 保证inode和数据块在一个group内,将同一个目录下面的文件放在一个group内。
The FFS policy heuristics are not based on extensive studies of filesystem traffic or anything particularly nuanced; rather, they are based on good old-fashioned common sense (isn’t that what CS stands for after all?)1. Files in a directory are often accessed together: imagine compiling a bunch of files and then linking them into a single executable. Be- cause such namespace-based locality exists, FFS will often improve performance, making sure that seeks between related files are nice and short.

关键思路 03: 处理大文件


Specifically, if the chunk size is large enough, the file system will spend most of its time transferring data from disk and just a (relatively) little time seeking between chunks of the block. This process of reducing an overhead by doing more work per overhead paid is called amortization and is a common technique in computer systems.

关键思路 04: Block 和 sub-blocks

​ FFS将block的大小增大为4k,减小了overhead,提高了性能。更加大的block也使得前面的bitmap结构更加小。带来的缺点就是可能更加多的内部碎片,因为一般情况下小文件总是占了大部分。FFS这里使用的解决方法是将一个block又可以在内部分为4个sub-blocks。好处就是文件都很小的时候能更充分利用空间,减少碎片,缺点就是处理这个使得系统的复杂程度增加了不少,有时候还会造成额外的数据移动。

0x03 Summary

Certainly all modern systems account for the main lesson of FFS: treat the disk like it’s a disk.


  1. A Fast File System for Unix, TOCS 1984.
  2. “Operating Systems: Three Easy Pieces“ (Chapter: Locality and The Fast File System) by Remzi Arpaci-Dusseau and Andrea Arpaci-Dusseau. Arpaci-Dusseau Books, 2014.