我们该如何保护归档系统？

林海缘 · 发表于 2010-5-5 21:29:16

我们该如何保护归档系统？
将数据从主存储迁移到二级存储会给企业机构带来巨大好处。二级存储减少了对另外采购主存储的需求，缩短了备份窗口，减少了备份基础架构投资，并且为数据保留和法规遵从策略打下基础。理想情况下，二级存储只保存那些静态数据的唯一拷贝。因此，保护归档层要求有一个高度冗余、高可用的系统。

如果归档层只保存数据的唯一拷贝，那么这个层不可能仅仅由一个廉价NAS头后面的多个廉价磁盘组成。必须有专门针对可靠性和耐用性设计的全新存储系统来支持要求的冗余性。所幸的是，归档系统在其他方面的要求，例如可扩展性和容量优化等，可以被作为归档保护流程的一部分。

一些系统可以通过搭建一个存储节点集群来解决规模上的要求。当需要更多存储容量的时候，你只需要增加一个节点就行了。系统会自动识别新节点并开始使用新增容量。这些节点还提供了一个冗余架构用于维持数据可用性。即使一个甚至两个节点(同时)发生故障也不会有任何数据丢失或者丢失数据访问路径。

其次，系统可以利用集群存储架构来提供一种高级的数据保护功能。这非常重要，因为随着驱动器容量持续增加，尤其是现在2TB硬盘已经步入主流，传统的RAID 5甚至是RAID 6在系统恢复时间方面已经开始接近其实际限制。

传统RAID系统的挑战在于将一个存储系统恢复到完全运转和冗余保护状态下所需要的时间。如果一个驱动器发生故障，一旦识别到一个全局备件或者替换了故障驱动器，大多数RAID技术会启动一个重建流程。对于大容量1TB和2TB驱动器来说，这个重建的过程可能需要几个小时甚至几天时间。在重建过程中，归档数据——企业机构的唯一数据拷贝——是完全暴露的。

如果一个二级驱动器发生故障的话，这些数据就会永久性地丢失，因为重建过程中发生读取故障的几率大大提高了。甚至是RAID 6也提供了某种保护，因为其重建过程非常漫长，所以在这个过程结束之前第三个驱动器故障发生的几率大幅度增加了——因为通常在大型驱动器部署中会涉及更多的驱动器。虽然相对来说这种情况发生的几率不高，可一旦发生的话，数据唯一拷贝丢失的风险就是100%。因此，我们需要一个更加高效和防故障的保护措施。

归档系统可以从以下两种途径中的任何一个来解决这个难题：要么通过镜像，要么使用高等级的RAID。在小型部署环境中，使用镜像的方法比较简单。虽然镜像所产生的第二份拷贝会提高成本，但是它所提供的冗余性可以保证快速恢复。对于大多数小型环境来说，归档系统的初始大小可以弥补镜像所导致的容量减少。

在更大型的环境中，镜像对所有数据的“一对一”拷贝所带来的成本是无法承受的，这也是为什么人们通常会选择RAID作为替代方案的原因。然而，RAID并不能解决数据风险问题，因为当检测出错误的时候只简单地重建RAID组并不是提高数据完整性的有效方法。有一种替代方法，就是使用更高等级的RAID。例如，有些RAID技术，能够将数据分割成多个块，并将其分布到不同存储节点的驱动器中。如果一个节点发生故障，其他数据块就会聚合起来。如果两个节点(现在每个节点包括四个驱动器)发生故障，数据仍然是完整的。这种方法比RAID的奇偶校验提供了更强大的数据保护算法。

节点和驱动器的故障是很容易发现的，但是更令人关注的是“未察觉的数据丢失”。在这种情况下，一个驱动器可能会降级到未发生实际故障的点，但是这个驱动器上的数据可能被损毁。如何检测出这种数据损毁呢？对于传统系统来说，确认数据损毁的唯一方法就是在数据读取过程中。如果数据的多个拷贝分布在磁盘和磁带上，那么可以从这些设备中的一个上进行恢复。但是这种保留了数据冗余拷贝的方法首先就会使归档失去意义，而且会增加成本。

采用了另一种为我们所熟知的技术的归档系统可以解决这个问题。重复数据删除是一种可以被归档系统用来优化存储容量的技术。重复数据删除算法会针对每个写入的数据块生成一个签名，而且这个签名对于这个数据块来说是唯一的。如果签名再次出现，那么第二个数据副本就不会被写入到磁盘中。

归档系统可以利用这种签名来保护数据和优化空间，并利用签名信息来验证磁盘上保存的数据。归档系统会定期地针对保存的数据块运行这个算法，而且每次运行的时候签名都应该是相同的，否则就可能存在某种数据损毁。因为归档系统能够从RAIN保护策略中生成数据，因此数据损毁可以被“修复”，抢救重要信息。

当制定一个全面优化的归档策略是，复制是一个关键环节。复制提供了第二个、但是受管理的数据拷贝。它不仅可以防止发生站点故障，而且可以在其他所有保护措施失效的情况下防止某些数据丢失。因为这是单一的管理拷贝，所以数据保留策略和原始归档拷贝是一致的。

重复数据删除也可以用来实现一个支持WAN的数据复制策略。在这种复制条件下，只有那些对于灾难恢复站点中目标系统唯一的变更数据块才会被发送，即使源数据是来自于多个站点。例如，三个站点可能被复制到一个灾难恢复站点。当其中一个主站点准备发送最近有变更或者添加的数据时，如果某些数据已经存在于远程站点，那么这些数据就不会被发生。这种方法不仅减少了需要在灾难恢复站点保存的数据量，而且还减少了所需的WAN带宽。

为了让磁盘归档实现降低存储和保护成本，用户必须信任这种安全且可靠地保存数据唯一副本的特性。长期保护归档数据的完整性对于确保这些副本不会丢失来说是非常关键的。

帐号		自动登录	找回密码
密码			审核注册