| 
 咨询电话:010-51727811/12/13
当前位置: 首页 > 新闻中心 > 业内新闻 >
数据存储虚拟备份入门知识
时间:2013-05-30 09:25  来源:飞客数据恢复   作者:飞客数据恢复工程师
    虚拟磁带库(Virtual Tape Library,VTL),是近年来兴起的众多磁盘备份(Backup to Disk)解决方案中,最受瞩目的一项,虽然VTL问世的时间不过两年多,在国外却是相当热门的产品。虚拟磁带库的概念非常简单,它本质上是磁盘阵列硬件设备,但是在软件功能上模拟磁带备份的形式,因此对于存储管理员来讲,它就是一个磁带库,对它的管理如同管理一个物理磁带库一模一样。
 
虚拟磁带库综述
    虚拟磁带库就是在备份服务器或网络端上体现为传统磁带库的磁盘或磁盘阵列。我们将用磁盘为备份介质来存储数据,并且本身能够仿真成物理磁带库的产品,称之为虚拟磁带库。真正的虚拟磁带库,其使用方式与传统磁带库几乎相同,但由于采用磁盘作为存储介质,备份和恢复速度可达100MB/s以上,远远高于目前最快的磁带机。同时,磁盘阵列的RAID保护技术使虚拟磁带库系统的可用性、可靠性均比普通磁带库高出若干量级。
    虚拟磁带库的概念早在10余年前即已被IBM,StorageTek等著名存储厂商所采用。然而,受限于磁盘和虚拟磁带技术的发展,以及厂家为了保护其既有模拟磁带库市场的考量,长期以来虚拟磁带库以价格高昂著称,使其通常作为大型磁带库的前端缓存使用,且依附于特定的主机系统(“封闭系统”),市场认知度一直很低。而在近些年,磁盘技术快速发展,出现了多种类型磁盘(SCSI、FC、ATA、SATA),使单位容量磁盘存储的价格急剧下降,进而使磁盘阵列作为备份设备的应用也愈加广泛。
 
传统磁带库用户面临的困扰
    几年前,越来越多的用户意识到数据保护的重要性,纷纷采购磁带库和数据备份管理软件来搭建自己的数据备份系统。通过磁带库、用户可以进行复杂周密的介质管理,并利用备份软件实现高度的自动化。磁带介质还十分便于离线保存,可以定期从磁带库中取出,人工转移到另一点,实现异地容灾。但现在,这些用户逐渐痛苦的意识到,自动化的数据备份虽然提供了帮助,但也带来了很多新的问题,而这些问题正在严重威胁到原来设计备份方案的可行性。
 
让用户头疼的问题
 
1、可靠性
 
    磁带库的可靠性远不像磁带库厂商宣传的那样,平均无故障时间(MTBF—Mean Time Between Failure)、平均无故障换带次数(MSBF—Mean Swap Between Failure)等关键指标不能作为实际应用的参考基准,宣称可以工作几十万小时的磁带机在实际应用中往往一两年就开始出现故障;磁带库机械臂故障的概率也很高,尤其是中端以下(包括中端)磁带库用户,有相当大比例的用户至少经历过一次磁带库故障,导致备份的失败。
    磁带远不像想象的那样可靠。磁带对电磁、温度、湿度、灰尘等条件要求十分苛刻,虽然短时间内不一定能发现问题,但往往进行数据恢复的时候,意外地发现由于磁带的损坏,不能恢复数据。
 
2、性能
 
    目前磁带机的技术发展迅速,开放市场上主流产品中已经能够提高单盘容量几百GB的主流磁带机,每秒的读写速度可达几十MB。但磁带技术的发展仍然没有赶上数据量的爆炸式增长。同时,随着越来越多的业务要求7×24的工作时间,每个系统能留给备份的时间越来越少。如果能够在更短的时间内完成更多数据量的备份?用户别无选择,只能在磁带库中安装更多的磁带机。这意味着更多的支出、更高的故障率、当磁带技术更新的时候还意味着更大的投资浪费。即使这样,由于磁带库库体设计的限制,能增加的磁带机数量仍然有限。
    磁带设备的性能瓶颈不仅仅来自于读写速度。磁带加载所需要的时间有时候比读写的时间还要长,即使是最新式的磁带机在这一方面也没有明显的改进。用户要恢复的数据可能在多盘磁带上,如果要进行一次完整的系统恢复,由于频繁的加载磁带,恢复时间无法控制。
 
3、可扩展性
 
    数据量不断增加,而磁带库扩展的余地有限;如果一开始就采购比较大型的磁带库,即使采用较低的初始配置,其价格仍然很高;
 
4、投资回报率
 
    一方面磁带插槽很快就不够使用,另一方面几乎绝大部分磁带空间无法充分利用。由于备份管理上的要求,很多的磁带只写入了几十GB甚至几GB,却由于保存周期以及磁带分类管理等要求,不能写入新的数据。这样,一台号称几十TB的磁带库,可能只能利用不到一半的空间就必须考虑扩容了。
    由于磁带库技术比较封闭,大部分配件的维修、更换必须由磁带库原厂商工程师完成,这使得实际故障排除时间难以控制,而且成本很高。最终,用户会发现,用于数据保护的投资往往超出预算,最终的结果依旧不能让人满意或者不可预期;而备份系统本身反而增加了系统维护的工作量。这已经成为目前很多单位非常现实的问题。
 
5、虚拟磁带库:系统可用性较磁带库提高若干量级
 
    虚拟磁带库中,一般采用磁盘阵列作为后端存储设备。磁盘阵列采用的RAID技术能够保证当盘阵中某一块磁盘出现故障时,盘阵上的数据仍然可以正常读写。用户可以在线更换损坏的磁盘,然后对盘阵逻辑卷进行动重建。用户亦可设置在线热备盘,在出现一块磁盘(RAID6可以同时出现两块磁盘)损坏时,RAID控制器可以自动隔离故障盘,并立即开始逻辑卷自动重建,实现自动在线热恢复。保持了设备的连续可用性。
    而磁带库的机械手、磁带驱动器和磁带均为非封闭的精密部件,也不具备容错能力,很容易受灰尘、潮湿等环境因素的影响而导致故障。多个部件组合后整体系统的可用性将更低。可用性低也就使维护成本提高。据统计,2002 年在美国磁带库的平均年维护成本高达磁带库采购成本的10~15%,尤其令用户烦恼的是,磁带库修复必须由专业人员进行。维修反应时间长,常造成日常运营混乱。用户常因此而被迫购买冗余磁带驱动器 - 而驱动器恰恰是模拟磁带库中的主要昂贵部件,进一步加大了用户的总体拥有成本。
 
6、虚拟磁带库:备份可靠性较传统模拟磁带库提高若干量级
 
    备份本身不是目的,必须能够保障数据恢复,备份才有意义。而备份介质的可靠性决定了备份数据的可靠性。磁盘是密封结构,而磁带则暴露在空气中,易受粉尘、湿度、磁粉、粘连、霉点等因素的影响,出现读写错误。所以磁盘的MTBF(平均无故障间隔)一般为磁带的5倍以上。显而易见,采用受RAID保护的磁盘阵列系统存放备份数据,比只用单盘磁带存放数据的可靠性要高得多。  
    为了提高磁带存储的可靠性,很多用户采用磁带复制方式,实现数据双备份,这样不仅费时费力,同时将造成额外的运营成本。