微信号:ibmsoftware

介绍:IBM软件技术论坛www.ibmsoftware.cn欢迎您的加入!

TSM重复数据删除概念

2017-01-12 17:41 ibm软件技术联盟

重复数据删除

重复数据删除是一种通过消除冗余数据来减少存储需求的方法。

概述

在 Tivoli® Storage Manager 上可以进行两种类型的重复数据删除:客户机端重复数据删除和服务器端重复数据删除。

客户机端重复数据删除是在备份/归档客户机上使用的重复数据删除方法,用于在将数据传输到 Tivoli Storage Manager 服务器之前,除去备份和归档处理期间的冗余数据。使用客户机端重复数据删除可以减少通过局域网发送的数据量。

服务器端重复数据删除是通过服务器执行的重复数据删除方法。Tivoli Storage Manager 管理员可以指定要与 REGISTER NODE 或 UPDATE NODE 服务器命令上的 DEDUP 参数配合使用的重复数据删除位置(客户机或服务器)。


增强通过客户机端重复数据删除,您可以执行以下操作:

  • 从重复数据删除中排除客户机上的某些特定文件。

  • 启用重复数据删除高速缓存(用于减少客户机与服务器之间的网络流量)。高速缓存包含在先前的增量备份操作中发送到服务器的扩展数据块。 客户机不会在服务器中查询扩展数据块是否存在,而将查询其高速缓存。

    指定客户机高速缓存的大小和位置。如果检测到服务器和本地高速缓存之间不一致,那么将除去本地高速缓存并重新填充。

  • 同时启用客户机端重复数据删除和压缩,以减少服务器所存储的数据量。将各扩展数据块发送到服务器前,对其进行压缩。节省存储与压缩客户机数据所需的处理能力之间的权衡。通常,如果在客户机系统上压缩数据并进行重复数据删除,那么与只进行重复数据删除相比,大约要使用双倍的处理能力。

    服务器可处理压缩且已进行重复数据删除的数据。




客户机端重复数据删除使用以下过程:

  • 客户机创建扩展数据块。扩展数据块是与其他文件扩展数据块相比较的文件部分,用于识别重复内容。

  • 客户机和服务器协作以识别重复扩展数据块。客户机将非重复扩展数据块发送到服务器。

  • 后续客户机重复数据删除操作创建新的扩展数据块。 部分或全部这些扩展数据块可能与先前重复数据删除操作中创建并已发送到服务器的扩展数据块相匹配。 不会再次将匹配的扩展数据块发送到服务器。

益处

客户机端重复数据删除具有多种优势:

  • 可减少通过局域网 (LAN) 发送的数据量。

  • 识别重复数据所需的处理能力从服务器卸载到客户机节点。始终为启用了数据重复删除的存储池启用服务器端重复数据删除。但是,对启用了重复数据删除的存储池中的文件以及由客户机进行重复数据删除的文件,不需要进行其他处理。

  • 除去服务器上重复数据所需的处理能力已经消除,从而能够立即节省服务器上的空间。

客户机端重复数据删除可能有一个缺点。除非您将包含客户机扩展数据块的主存储池复制到未进行重复数据删除的副本存储池,否则服务器将不具有客户机文件的整个副本。(扩展数据块是重复数据删除期间创建的文件的一部分。)在将存储池备份到未进行重复数据删除的存储池期间,客户机扩展数据块将重新汇集为邻接文件。

服务器端重复数据删除可在更大程度上防止数据丢失。缺省情况下,必须首先将针对重复数据删除而设置的主顺序存取存储池备份到未进行重复数据删除的副本存储池,然后才能收回主顺序存取存储池以及除去重复数据。缺省值可确保无论是在主存储池中还是在副本存储池中,服务器始终具有整个文件的副本。


要点: 为进一步减少数据,可以将客户机端重复数据删除和压缩一起启用。各扩展数据块会在压缩之后发送到服务器。压缩可以节省空间,但会增加客户机工作站上的处理时间。


 
ibm软件技术联盟 更多文章 重磅视频【CCTV2《对话》】IBM 大中华区CTO沈晓卫:2017年的人工智能就是增强智能 邮储联合IBM试水信任机器 银行系区块链金融资产托管破局 重磅视频【CCTV2《对话》】IBM 大中华区CTO沈晓卫:2017年的人工智能就是增强智能 重磅视频【CCTV2《对话》】IBM 大中华区CTO沈晓卫:2017年的人工智能就是增强智能 人工智能变身医生好助手,未来看病是怎样一种体验?
猜您喜欢 KVM虚拟机cpu pinng实战-02 分析内核源码如何入手?(下)-《Linux内核修炼之道》精华分享与讨论(3) 三种解密 HTTPS 流量的方法介绍 一篇知乎短文及最近 Android 招聘 微信小程序持续高潮的背后应该有的思考