天天看点

内容寻址存储CAS技术浅析

 EMC Centera的RAIN体系结构

  Centera系统的体系结构主要由四个部分组成:所要存储的数据对象、应用软件服务器、Centera存储服务器和客户端数据库。整个数据的存储可以分为五个过程:

  (1)由应用软件服务器创建或使用数据对象;

  (2)应用软件服务器在IP通路上通过一套Centera的标准API把数据对象发送给Centera存储服务器;

  (3)Centera存储服务器按照特定算法针对所存储的数据内容片断的本身生成全局惟一的内容地址;

  (4)Centera存储服务器把这一内容地址返回给应用软件服务器;

  (5)内容地址由应用软件服务器保存在专用数据库中,以备客户端用户存取。

  Centera的CAS网络存储服务器采用了一套独特的可以避免任何单点故障(No-Single-Points-of-Failure)的RAIN(Redundant Array of Independent Nodes,独立节点的冗余阵列)存储体系结构,与CentraStar操作环境一起实现了一套集TB-PB安全高效扩展、自管理、自修复和自动重配置与一体的内容寻址存储系统。整个系统由很多节点构成,所有节点分为存储节点(Storage Nodes)和访问节点(Access Nodes),其中前者主要用于存储和保护数据,而后者主要为外部提供API访问。RAIN系统包含构成如下图所示。RAIN中的每一个节点都包含一套高端配置的计算机系统(典型配置:2GHz P4 CPU/512MB RAM/320GB EIDE/10/100BT NIC)和运行在Centera之上的操作环境CentraStar——在整个Centera中处于核心和关键地位。

  Centera的软硬件在一个机柜内实现了一套P2P透明的集群环境,而这个机柜对于CAS网络存储客户端用户而言不过是一个“黑箱”罢了。Centera的初始配置容量为2.9TB,并且还可以非常便捷地扩充至几百TB甚至PB。一个机柜就能装有8、16、24或32个完全一样的节点,可以分别提供3.8TB、7.7TB、11.5TB或15.4TB的映像存储容量。Centera的每一个节点都具备数据处理能力,都拥有1TB的原始数据存储能力,并具有通过一个私有LAN与CAS网络存储系统的其他集群节点进行互连。

  当需要向CAS网络存储系统增加存储容量时,新容量就作为“构建块”加入Centera的自配置系统,运行在Centera上的驻留软件就会通知整个网络存储系统有新的容量添加进来,并立刻为系统可用。

  Centera大大简化了网络存储系统的规划和管理,用户不必关心RAID类型,也不必担心LUN绑定,更不用考虑创建何种文件系统。应用程序和存储管理员可以从繁重的超大容量文件系统管理和极为复杂的多网络存储拓扑结构中解脱出来。

  据估计,在采用Centera的CAS网络存储系统中,一个管理员能够管理几百TB甚至PB级的数据,而在传统网络存储解决方案中仅能有效管理20TB~50TB的数据量。

  概括地讲,基于RAIN结构的CAS网络存储系统的特点主要包括以下几点:

  透明的P2P集群存储环境;

  自配置功能;

  各个节点均冗余;

  通过镜像和奇偶保护手段来加强内容保护;

  通过CDF+Blob来加强自诊断和自恢复能力;

  远程监控能力;

  不可能发生任何单点故障。

  EMC Centera存储系统的应用

  通过以上分析可以看出,面向固定内容存储的Centera网络存储系统较传统网络存储技术能够更好地适应信息急剧增长的实际需求,具有广阔的发展前景,可以广泛地应用到企业级内容/文档管理、HSM解决方案、PC备份和归档、E-mail服务、医疗成像等诸多领域,典型的Centera固定内容寻址存储的体系结构如下图所示。

  下面以Centera为例,简要地介绍一下CAS的具体应用。

  (1) 企业级内容/文档管理

  Centera在这类商业应用中使存储内容的可靠性和信息保存符合一般的企业级存储需求,并可以与应用程序简单地集成在一起,提高了可访问性;它高效率地利用存储设备;自配置、自管理和自恢复带来了低管理开销;存储内容与位置无关并使商业服务具有连续性。

  典型的Centera商业应用如下图所示。

  (2)E-mail服务

  Centera对电子邮件业务主要有以下功能:对邮件的透明化归档处理,无需用户插手;高效存储消除了大量邮件副本的存在,正好适合这类应用的需求;存储内容的可靠和保存;提高了可访问性;高效率的存储利用;自配置、自管理和自恢复所带来的低管理开销;大规模可扩展性。

  Centera的电子邮件服务如下图所示。

  (3)医疗成像

  Centera对医疗成像系统的影响主要包括以下几个方面:存储内容的可靠性和保存符合一般的企业级存储需求;非常容易地访问大量归档信息;大规模可扩展性;自配置、自管理和自恢复所带来的低管理开销;保证技术的长久适应性。

  CAS标准化进程

  正是由于CAS技术在归档及固定内容存储和恢复参考信息领域所具有的独特优势,才使业内越来越认识到了为这个新兴技术建立业内标准的紧迫性和重要性。如今,SNIA正在联合CAS领域内的两个领军人物EMC和Permabit 共同制定关于固定内容寻址存储解决方案的相关标准,即Content Addressable Storage Solutions Initiative(CASSI)。今后,CASSI还将作为SNIA的数据管理论坛和信息生命周期管理计划的一部分。

  CASSI将始终关注CAS技术的发展,为最终用户和相关厂商提供各种相关的及时有效的信息资源和工业标准解决方案。除此之外,CASSI中最主要的工作目标就是为CAS技术设定基于存储管理界面的统一的管理界面。(注:存储管理界面SMI是SNIA开发的一种标准管理接口,旨在减轻多厂商SAN环境的管理负担。SMI-S为各种网络组件提供了一个通用管理接口,减小了SAN管理的复杂性。)

  世界著名的评估公司Evaluator Group的资深分析家Randy Kerns指出,在存储领域里有好几个有关数据记录与保存的认证机构,而到目前几乎还没有任何基于磁盘记录的CAS产品拥有这些认证。

  既然这样,那么未来的CAS网络存储之路是继续走“市场应用完全决定标准制定”呢,还是“在标准化旗帜下大家一起奋勇前进”呢?在笔者看来,有关服务商在努力改进并极力推广其解决方案的同时,能够积极地关注全球网络存储标准化的进程应该是非常明智的举措,毕竟蛋糕虽大,一人难吃。

  CAS网络存储技术的前景究竟如何,我们还是拭目以待吧!

继续阅读