Review
在上一期电子报中,我们跟大家谈到分布式储存崛起的背景,及软体定义储存于分布式储存之应用。
本期电子报,将为大家针对分布式储存的资料储存界面协议,及几个较广泛被应用于分布式储存之开源软体,进一步介绍说明,协助读者对分布式储存面临的挑战及规划管理有更多的认识及理解。
分布式储存体系结构:分布式块储存、分布式文件储存、分布式对象储存
分布式储存依照不同的资料储存界面协议,分为块储存、文件储存和对象储存三种,它们之间有很大的差异及不同的特色,了解各自特色优势,将可做更好的组合运用,规划更完善的分布式储存系统架构。
块储存 主要是将挂载的裸硬盘空间进行分区、格式化后,映射给主机使用。其优点是可以将多块廉价的硬盘组合成为一个大容量的逻辑磁盘对外提供服务,除了提高容量外,多块硬盘组合出来的逻辑磁盘可以并行写入,提升效率。若块储存采用SAN架构组网,根据SAN的传输速率及封装协议,更是大幅提升其在传输与读写之速率。然而,在操作系统使用不同的文件系统或是服务器不做丛集的情况下,无法在不同主机间共享数据,是块储存的缺点。
文件储存 与块储存不同,文件储存已经具有自己处理文件管理的功能,主机不需要再对文件储存进行格式化,可直接对文件储存进行文件的上传下载;同时可管理用户权限、文件锁定和其他安全措施,方便多个用户同时访问文件,很好地规避了块储存不利于分享的缺点。而且以文件为传输协议,可扩展性好、价格便宜、用户易管理,是其主要的优点。但是因其运行于以太网上,上传下载速度较慢,相比于块储存,动辄几十上百块硬盘同时读写,速率慢了许多。另一方面,低频宽、高延迟等缺点,亦不利于在高性能丛集中应用。
鉴于块储存与文件储存有各自的局限,加上现今大部分的资料都是非结构化资料,对象储存因应而起。对象储存之特点在于将元数据独立出来,当用户访问对象储存时,会先访问元数据服务器,即可查找到对象储存在那些服务器上,加快资料访问速度。与上述两种储存方式相比,对象储存的主要区别是它支持应用程序本身来管理对象,这意味着对象储存不需要真正的文件系统,所以对象储存解决方案比文件储存或根据块储存的系统更容易扩展,它克服了块储存与文件储存各自的缺点,并结合两者之优点。
既然对象储存兼具了块储存与文件储存的好处,为甚么在分布式储存中还要使用块储存或文件储存呢?
- 部分应用需要储存直接裸碟映射方式进行。例如资料库,需要储存裸碟映射给资料库后,资料库再根据自己的文件系统来对裸碟进行格式化,无法用其他文件系统已格式化的硬盘,故此类应用更适合使用块储存。
- 对象储存需要购买专门的对象储存软体以及大容量硬盘,成本较普通的文件储存高,所以若只为做文件共享需求,但对资料量要求非海量等级,直接用文件储存的形式性价比更高。
综合上述介绍可知,块储存、文件储存、对象储存的资料储存方式各有其特点,而分布式储存可以依据适用场景的不同,结合各种储存方式优势,弹性地设计出最合适的组合架构服务应用。 以下是三种储存方法的对比表格:
下表比较了前三种存储方法:
分布式储存系统常用开源软体介绍
接下来,我们将从几个较广泛被应用于分布式储存之开源软体,包括Ceph、GlusterFS、DRBD等介绍,让大家对分布式储存有更多的了解。
Ceph:一个开源的统一分布式文件系统,可在一个统一的系统中提供对象、块(通过RBD)和文件储存,为IT基础建设管理储存大量的资料。Ceph是一个不管资料的类型如何,皆以对象形式储存的储存解决方案,可执行资料复制,故障检测和恢复,以及跨丛集节点的资料迁移和重新平衡等,尽可能地保护资料在不同节点,确保资料一致性。具有高效能、高扩展及高可用等特性。
GlusterFS:也是一个开源的分布式文件系统,它使用「转换器」的概念,允许创建具有各种功能的文件系统,包括镜像和复制,分条,负载平衡,磁盘缓存,预读,写后传输,并自我修复。其优势之一是它不使用元数据服务器,而是使用散列机制来查找资料。相较于Ceph,GlusterFS提供了快速的储存扩展,且更易于伸缩。
Distributed Replicated Block Device (DRBD). 是Linux系统下一套根据软体、无共享、复制的储存解决方案,利用网路在服务器之间对块设备(硬盘,分区,逻辑卷等)进行镜像,类似于一个网路RAID1功能。在高可用(HA)中使用DRBD功能,可以代替使用一个共享磁盘阵列。本地(主节点)与远程主机(备节点)的资料可以保证实时同步,当本地系统出现故障时,远程主机上还会保留有一份相同的资料,可以继续使用。
以下是上述三种分布式储存软体的特点整理:
Want more information?
如您在阅读本文后,针对分布式储存或是建构创新储存解决方案,有兴趣进一步了解,请透过本电子报下面联繫方式,与我司接洽了解。
关注我们
请与我们的社交媒体保持联系,获取最新消息