为了确保服务质量,飞客针对 RAID 数据恢复建立了特别的工作流程,由专职工程师与管理人员负责。在近期的一起 RAID 数据灾难处理过程中,特殊的 RAID7 磁盘阵列让工程师经历了难忘的两天两夜。上海闵兴机电设备有限公司的一台 RAID7 服务器突然数据崩溃,其中存储着多年的财务数据与客户数据,还包括部分研发资料。这台服务器其实才购买不到半年,厂商也可能负责设备维修,但是其中的数据无法确保完好,因此海闵兴机电设备有限公司的信息管理员在第一时间找到了飞客,并希望在数据恢复成功后再去更换设备。
其实 RAID 7 不仅仅是一种技术,还是一种存储计算机。因为它与 RAID 0 、 1 、 5 标准有明显区别, RAID 7 自身带有智能化实时操作系统和用于存储管理的软件工具,可完全独立于主机运行,不占用主机 CPU 资源。 RAID 7 不仅具有更高的性能和卓越的存储管理能力,而且集普通 RAID 标准的所有优点于一身,因而 RAID 7 系统整体性能极佳。
RAID 7 是一套实时事件驱动操作系统,主要用来进行系统初始化和安排 RAID 7 磁盘阵列的所有数据传输,并把它们转换到相应的物理存储驱动器上。通过自身系统中的阵列电脑板来设定和控制读写速度,存储计算机操作系统可使主机 I/O 传递性能达到最佳。如果一个磁盘出现故障,还可自动执行恢复操作,并可管理备份磁盘的重建过程。
更为重要的区别是, RAID 7 突破了以往 RAID 标准的技术架构,采用了非同步访问,极大地减轻了数据写瓶颈,提高了 I/O 速度。所谓非同步访问,即 RAID 7 的每个 I/O 接口都有一条专用的高速通道,作为数据或控制信息的流通路径,因此可独立地控制自身系统中每个磁盘的数据存取。如果 RAID 7 有 N 个磁盘,那么除去一个校验盘(用作冗余计算)外,可同时处理 N - 1 个主机系统随机发出的读 / 写指令,从而显著地改善了 I/O 应用。 RAID 7 系统内置实时操作系统还可自动对主机发送过来的读 / 写指令进行优化处理,以智能化方式将可能被读取的数据预先读入快速缓存中,从而大大减少了磁头的转动次数,提高了 I/O 速度。
虽说 RAID 7 可帮助用户有效地管理日益庞大的数据存储系统,并使系统的运行效率提高至少一倍以上,但是这种磁盘阵列本身在数据冗余安全性上并没有质的提高,而且也给数据恢复中的重组分析带来诸多困难。根据飞客工程师当时的检验结果,整个 RAID 7 崩溃后出现两个硬盘掉线,并且是严重的物理损坏。直接采用分析重组方法固然是可行的,但是这样至少需要花费一个星期的时间(因为数据量达到 TB 级别),而闵兴机电设备有限公司根本无法等待那么长的时间。
在与客户协商之后,飞客工程师备份所有硬盘后的镜像文件后直接在服务器上进行重组操作,这样可以争取到更多的时间。事实也证明这样的方法是最为理想的,最终整个磁盘阵列的数据完全恢复,并且后续的 SQL Server 数据库修复也十分顺利。根据飞客工程师的总结报告介绍, RAID 7 磁盘整理的校验方法与普通 RAID 5 有着不小的区别,常见的方法根本无法进行恢复。凭借去年飞客研发部研发的一整套分析重组方法,最终从底层原理上进行彻底操作,这才是真正的捷径,而并非依赖于某几款国外软件。