| 
 咨询电话:010-51727811/12/13
当前位置: 首页 > 新闻中心 > 业内新闻 >
解析数据存储的根本(一)
时间:2012-07-23 09:12  来源:飞客数据恢复   作者:飞客数据恢复工程师
在NAS的系统中存在如下的缺点:
其一是传输能力有限。在NAS中,数据的传输通过现有的局域网实现,但局域网原本是用来实现消息传递的,只适合短暂的突发数据传输,不能满足大容量连续数据传输的要求;同时,网络上大量计算机之间的通信也会占用有限的网络带宽,所以当网络规模较大时,必然会导致数据传输速率减慢。
其二是可扩展性有限。虽然当存储空间不足时,在网络中增加一台NAS设备非常容易,但新的NAS设备要求有新的IP地址,无法与原有的NAS设备集成为一体,不能形成一个连续的文件系统,从而增加了存取和管理的复杂度。
其三是数据备份能力有限并且不能对数据库服务提供有效的支持。通常,NAS设备不能支持存储设备之间的直接备份,只能采用基于网络的备份,这样会在数据备份时占用大量的网络带宽,严重影响网络上其他应用的运行,而且数据备份的速度也相对较慢。
 
SAN存储的特点
相对于NAS网络存储,SAN存储有着如下的优点。
其一是为每台主机提供了更多的可控存储容量。SAN并没有提高单个磁盘驱动器的容量,也没有增加主机系统中支持的主机I/O控制器的数量,但它能显著提高连接到每台主机I/O控制器的设备数。它还提供了通过级联网络交换机和集线器来扩展容量的方法,例如,光纤仲裁环网能支持多达126台设备,而对于交换结构的光纤网络和IP网络来说,SAN具有无限寻址的能力。
其二是可提供更高的传输带宽。目前光纤网络可提供4Gb/s的带宽,而千兆以太网可提供1Gb/s的带宽。此外,与共享带宽的总线和网络相比,使用交换网络的SAN为数据存取提供了更好的可扩展性,网络的传输带宽可以成倍地增长。
其三是可提供更长的连接距离。SAN能以高速在很长的距离上运作,在采用光纤通道协议(FiberChannelProtocol,FCP)的FC-SAN中,使用单模光纤且不使用重发器,就可支持长达10公里的数据传输;而使用IP网络进行数据传输的IP-SAN则可以在广域网上传输数据,从而使数据的存取不再受区域的限制。
其四是在数据可用和共享方面的优势。服务器和数据的分离以及面向网络的集中存储使数据的安全性和可用性大大提高。而且,利用SAN的远距离连接能力,通过数据镜像等操作,即使系统遭受区域灾害(如洪水、火灾、大规模电力故障等),也能很快完成数据的灾难恢复。同时,面向网络的集中存储和多路径的数据交换使数据共享变得非常容易。
 
架构中的基本概念
近线和离线存储
所谓分级存储,就是根据数据不同的重要性、访问频次等指标分别存储在不同性能的存储设备上,采取不同的存储方式。这样一方面可大大减少非重要性数据在一级本地磁盘所占用的空间,还可加快整个系统的存储性能。在这里就涉及到几种不同性能的存储设备和不同的存储形式了。
目前常用于数据存储的存储设备主要有磁盘(包括磁盘阵列)、磁带(包括磁带机和磁带库)和光盘(包括一切CD-R、CD-RW、DVD-R、DVD-RW等光盘塔和光盘库设备)。从性能上来说,磁盘当然是最好的,光盘次之,最差的是磁带。而从价格上来说,单位容量成本上升磁盘最贵、光盘次之,磁带最低。这就为我们不同的应用追求最佳性价比提供了条件,因为这些不同的存储媒介可应用于不同的存储方式中。这不同的存储形式包括在线存储(OnStore)、近线存储(NearStore)和离线存储(OffStore)。
在分级数据存储结构中,磁带库等成本较低的存储资源用来存放访问频率较低的信息,而磁盘或磁盘阵列等成本高、速度快的设备,用来存储经常访问的重要信息。数据分级存储的工作原理是基于数据访问的局部性。通过将不经常访问的数据自动移到存储层次中较低的层次,释放出较高成本的存储空间给更频繁访问的数据,可以获得更好的总体性价比。
今天企业的数据中心非常复杂,数据保护是其关键。但是,并非所有的数据都具有同样的价值,也并非所有的企业都具有同样的需求。的确如此,通常认为企业中的关键和非关键数据量也符合“二八原则”,就是只有20%的关键数据,而80%都是非关键的。系统中60%至80%的数据经常在一个月,甚至一年中都不会被访问。而在经常访问的数据中,重要性差别也十分突出,有的数据与用户的业务联系紧密,可靠性、可用性及性能要求都很高,有的尽管经常使用但是与业务联系不是特别紧密。一般来说,重用数据的概率自数据创建3天之后就会下降50%,当数据创建30天后,重用的概率通常会降至很低,而高达90%的数据超过90天后就不会或很少被读取。为了提供良好的数据保护,IT部门通常都保留巨大的空余空间,用以防止出现容量不足的现象。
IT企业总是要面对增长起来无休无止的数据量。各种应用都在创建越来越大的文件,用户也很少删除数据和存档,这就导致要访问旧一些的文件已经变得非常困难。之所以要采取分组存储,是因为它既能最大限度地满足用户随时访问所有需要经常使用的数据,又可使存储成本最小化。综合起来,可以得出分级存储的优点主要体现在以下两个方面:
 
1.减少总体存储成本
在传统的在线存储中,所有数据都存储在一线磁盘存储设备上,而由于绝大多数数据的访问率并不高,占住了大量宝贵的磁盘空间,在一定程度上是一种浪费。如果把这些数据转移到存储性能稍低的磁盘(如IDE或SATA接口磁盘)或光盘存储设备上,存储成本可得以大幅降低。
 
2.提高整体系统性能
由于绝大部分数据转移到下级存储设备上,那需要时刻保持在线的数据就少了,系统资源的占用也就少了许多,整体系统性能自然也就提高了。如果采用了离线存储方式对很少使用的数据保存在像磁带这样的离线存储媒体上时,则不仅可提高系统性能,还可确保数据的安全性。
 
iSCSI技术
随着TCP/IP在互联网上的发展,TCP/IP已经成为了事实上的网络协议标准,现有的架构、标准、协议如果结合FC-SAN,是否能够减低SAN系统成本呢?厂商推出了IP-SAN和ISCSI,IP-SAN主要解决的是SAN的管理问题,ISCSI解决是SAN的成本问题。ISCSI的出现,标志着低价化SAN方案的问世,一圆中小企业也能够建置SAN的梦想。
自2003年SNIA(存储网络产业协会;TheStorageNetworkingIndustryAssociate)通过ISCSI协议后,厂商有了统一的IP-SAN方案,另外2003年微软宣布了在Windows2003中提供ISCSI支持,ISCSI在此之后获得了很大发展。ISCSI理论上可以用在DAS、NAS、SAN各种存储方案上面,不过目前主流还是在SAN上的应用。
所谓ISCSI就是通过IP协议将SCSI区块数据转换成网络封包的一种传输标准,它和NAS一样透过IP网络来传输数据,但在数据存取方式上,则采用与NAS不同的,而与FC-SAN相同的BlockProtocol协议。IP协议使得ISCSI可以使用普通交换机,而不必使用昂贵的光纤交换机,而且懂得IP协议的人很多,比起光纤SAN的人员培训要省不少费用;使用IP协议的另外一个好处是如果随着以太网的速度进一步提升,ISCSI的网络传输速度也会提升,采用10G以太网协议的ISCSI甚至会超过下一代光纤FC-SAN的4G标准;另一方面采用了与FC-SAN相同的BlockProtocol协议,虽然无法与FC-SAN想比,不过在存储速度超过使用文件协议的NAS不少。
左下图是一个比较简单的iSCSI存储系统结构图,这是一个采用统一数据存储中心的结构图,通过上面我们清楚地知道该系统虽然是一个新建的iSCSI存储系统,但它并没有改变原有的网络结构。
首先我们需要了解的是客户端与数据存储中心的连接,它们之间的连接有两种方式。一种是在客户端上采用普通网卡加协议转换软件的形式,另外一种是直接在客户端采用iSCSI适配卡的连接方式。采用普通网卡加协议转换软件的形式虽然能节约资金投入,不过这种连接方式会造成CPU资源大量被占用,并且转换率也不高。而采用iSCSI适配卡连接的方式,会大大提高数据传输速度,并且占有CPU资源非常小。实际上iSCSI适配卡也相当于一块网卡,不过iSCSI适配卡价格比较昂贵。因此,用户在选择时一定要根据自己的实际情况决定。无论硬件还是软件方式都称为iSCSIInitiator。
iSCSI服务器主要的作用在于将SCSI指令封包并置入到TCP/IP封包里,也就是当客户端发出请求后,iSCSI命令和数据达到iSCSI服务器进行处理,然后iSCSI服务器根据请求命令调用数据存储中心的数据反馈给客户端用户,它主要用来为客户端调用存储空间或者存储的数据。
交换机在系统中的作用跟网络中普通的交换机一样,只是起一个连接iSCSI存储服务器和iSCSI存储设备的作用。不过也有厂商推出专用的iSCSI交换机,如思科的5400系列iSCSI交换机。
iSCSI存储设备主要是用来保存大量的数据,也就是我们通常所说的磁盘阵列等。在交换机与iSCSI存储设备这里我们能看出,如果我们需要增加整个iSCSI系统的存储容量,只需要购买存储设备连接到iSCSI交换机上面就可以了,这样就大大增加了整个iSCSI系统的可扩展性,并且在增加存储设备的同时,我们并不需要关掉服务器等。
在存储设备这端负责将SCSI协议从IP包中分离出来的设备称为iSCSITarget。iSCSI存储设备已经包含了iSCSITarget,如果仅仅是普通磁盘阵列那么就需要购买一个iSCSI网关作为iSCSITarget连接阵列和iSCSI交换机。