加载中…
个人资料
古猫先生-存储随笔
古猫先生-存储随笔
  • 博客等级:
  • 博客积分:0
  • 博客访问:35,691
  • 关注人气:10
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

文件系统F2FS也将造福SSD

(2017-04-21 13:31:07)
标签:

f2fs

ssd

分类: 文件系统
F2FS有什么背景让华为大肆宣扬呢?
F2FS (Flash Friendly File System) 是三星做的一个开源的针对于flash memory的文件系统,已经被Linux merge到了kernel中,专门为基于 NAND 的存储设备设计的新型开源 flash 文件系统。特别针对NAND 闪存存储介质做了友好设计。F2FS 于2012年12月进入Linux 3.8 内核。目前,F2FS仅支持Linux操作系统。
由三星在NAND闪存上使用,它的特点是相较EXT3/4分区格式,显著提高了4K性能,也就是小文件的读取速度。

【F2FS与SSD的缘分】
针对SSD的各种特性,F2FS文件系统做了一些针对性的优化。
1)采用Log-structured File System的形式。因为这种形式把整个存储设备当作一个环形log一样顺序的写,这符合SSD顺序写的特性。整个文件系统被分为了以segment为单位的区间,每个segment固定大小为2MB。一个section由多个连续的segment组成,一个zone由多个section组成。默认情况下section和zone的size被设定为一个segment的size,但可以随便改。

                                            align with the zone size <-|
                 |-> align with the segment size
 _________________________________________________________________________
 |            |            |   Segment   |    Node     |   Segment  |      |
 | Superblock | Checkpoint |    Info.    |   Address   |   Summary  | Main |
 |    (SB)    |   (CP)     | Table (SIT) | Table (NAT) | Area (SSA) |      |
 |____________|_____2______|______N______|______N______|______N_____|__N___|
                                                                      .     .
                                                            .               .
                                                .                           .
                                  .__________________________________________
                                  |_Segment_|_..._|_Segment_|_..._|_Segment_|
                                  .           .
                                  ._________._________
                                  |_section_|__...__|_
                                  .            .
                 .________.
                         |__zone__|

2)解决Wandering Tree Problem。首先定义Wandering Tree Problem:每一次写操作都要写入一个新的位置,在更新inode存储中,要更新direct table的指针也需要重写,这个page也要写到新的block中,而上一级的indirect table因此也需要重写,这样一连串的重写会一直走到树根。同时inode map和checkpoint block也需要重写。他依然采用了经典的inode,但做了一个Node Address Table(NAT),这个表是扁平化的,包含了所有node block的位置,可以认为inode里存储的是逻辑地址,NAT转换为真实的物理地址。

3)Block分配。它将数据和node划分为cold、warm、hot三种类型,共计6种形式。

这些数据被分配在6个log中。他把appended data当作cold,因为只写一次就好,把更新的data当作warm,因为这到后来需要garbage collection。这就充分利用了SSD的特性:GC的时候,由于Warm中的data经常需要更新,因此里面包含了大量的invalid page,这是桌重要找的地方。

4)Garbage Collection

两种策略:Greedy和Cost-benefit。Greedy就找invalid pages最多的block来当victim,而Cost-benefit算法不但要考虑invalid pages,还要考虑segment age,以延长SSD读写寿命。

附录:【关于inode】

inode是什么?

理解inode,要从文件储存说起。

文件储存在硬盘上,硬盘的最小存储单位叫做"扇区"(Sector)。每个扇区储存512字节(相当于0.5KB)。


操作系统读取硬盘的时候,不会一个个扇区地读取,这样效率太低,而是一次性连续读取多个扇区,即一次性读取一个"块"(block)。这种由多个扇区组成的"块",是文件存取的最小单位。"块"的大小,最常见的是4KB,即连续八个 sector组成一个 block。


文件数据都储存在"块"中,那么很显然,我们还必须找到一个地方储存文件的元信息,比如文件的创建者、文件的创建日期、文件的大小等等。这种储存文件元信息的区域就叫做inode,中文译名为"索引节点"。


每一个文件都有对应的inode,里面包含了与该文件有关的一些信息。


更多内容,请关注微信公众号:存储随笔,ID: Memory-logger,

文件系统F2FS也将造福SSD

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有