对大家推荐很好使用的数据归档系统,想让大家对数据归档系统有所了解,然后对数据归档系统全面讲解介绍,希望对大家有用人们对数据备份和数据归档之间的争论由来已久。最近这几年,某些数据备份和恢复组织宣称:“备份不是归档”。不过,由于备份软件的功能越来越多,这个问题似乎又有了新的答案。
一些新的备份软件加入了重复数据删除功能以及可以在各存储层之间进行数据生命周期管理的功能。备份软件可以实现归档软件的功能吗?这两个软件在本质上是有区别的,那它们还可以结合在一起吗?
数据备份和数据归档的区别是什么?
数据备份和数据归档有许多不同点。首先,数据备份是将数据拷贝到顺序读写的介质上,而数据归档是将数据转移到速度稍微低一些的随机读写的介质上。数据备份一般都会保留多个副本,而数据归档通常通过重复数据删除或者CAS技术只保留一份。
两者另外一个很大的区别是,数据归档的重点是为文件提供索引和搜索功能,而数据备份则侧重于对备份策略或者备份后的镜像进行搜索。最后一个不同点是,备份的数据通常保存的时间比较短,主要是用在数据恢复的时候,而归档后的数据一般要保存很长一段时间,因为法律对此都有明文的规定。
大部分的数据归档软件都提供重复数据删除功能,常用的方式有以下几种:单实例存储,文件级别重复数据删除,块级别重复数据删除,内容地址存储算法等。在此之前,数据备份软件只能使用第三方的硬盘设备来完成重复数据删除。
而现在,一些着名的数据备份软件厂商如CommVault 系统公司、EMC公司、IBM公司和赛门铁克公司在各自的备份软件中都实现了重复数据删除。这项功能的出现也消除了原先人们认为数据备份不支持单实例存储的说法。
数据备份软件另外一个新增的功能是:数据生命周期管理。原来单个的备份镜像受到时间的限制,而两层存储备份方式又受到应用的限制,所以现在大部分的备份软件都支持多层存储,这样就可以根据不同的目标,例如,服务级别,恢复时间目标,恢复点目标等来制定不同的备份策略。
将关键的应用程序备份到硬盘上,将一些不是很关键的应用程序备份到顺序读写的设备上。备份软件可以让数据根据各自的年龄在各层之间转移,这样在恢复数据时可以保证各层数据读写的连续性。不过,在这个过程中,它的操作对象的最小单元是整个备份的镜像,这一点跟数据归档是没法比的。(数据归档的生命周期管理是基于文件级别的)
由于两者本质的不同,数据归档软件中的有些功能是绝对不能用在数据备份软件中的,例如,在文件级别进行搜索或者建立索引。因为数据备份是基于镜像级别的,所以它根本不能对每个文件建立索引。不过,在运行电子发现程序或者搜索业务数据时所用的全文搜索跟上面的搜索是不一样的。
CommVault公司的Simpana、IBM的Content Manager 和赛门铁克公司的 Enterprise Vault属于归档软件,不过它们在产品中都加入了数据备份的功能,例如搜索备份的数据等。搜索功能只适用于归档的数据,对备份的数据无效。数据归档的另外一个特性是可以随机读取。所有的归档都是在硬盘上运行的,并且是基于文件系统的。
相比之下,所有备份的数据都是顺序读写的(tar或者cpio)。这意味着,每次读取数据时,不管它的大小,备份都需要从头开始读取备份文件。这种方式不用考虑文件存放在何种介质上。
在备份时需要快速写入备份的文件中,在恢复时需要快速的读取备份的内容。而对单个文件修改或者搜索时,速度不一定快。数据归档的两个基本的特性:搜索功能和随机读写,是备份软件无法获取的。
数据备份由来已久并且引用了很多数据归档软件中的功能。由于它们的功能相互补充,数据备份和数据归档以后还会继续存在下去,而且不能彼此取代对方。