重删在带来空间节省、IO效率提高的同时，有什么弊端？

现在重删技术广泛用于备份领域，如知名的EMC DD。那么在存储领域，重删技术在各厂商之间也是各有一手儿，现在SVC在后续版本中是否已经考虑了融入重删技术？重删在带来空间节省、IO效率提高有什么其他的弊端没？

参与42

9同行回答
全部行业
全部行业 IT咨询服务 互联网服务 系统集成 银行 IT其它
|
按赞同排序
按时间排序

wangql系统工程师NULL

重删是个好东西，我笔记本装了win10后都配了deduplication，配合ssd非常好。现在的缺陷就是性能有些损耗，毕竟要耗费资源去做重删这个工作。

如果是企业级产品，把重删集成到硬件存储里，效果非常不错。对主机端的性能没有影响。用过ibm的7650G和emc的dd670。去重率高的吓人，当然这也和备份系统使用，数据本来就重复的多相关。可能两家厂商在底层算法上各有千秋，但作为使用者，还真感觉不到啥差别，用户也不太在乎。

svc现在有RTC，实时数据压缩，可惜没实测过，用过的朋友的可以聊聊

收起

IT咨询服务 · 2016-01-21

查看赞同的人

kkkru技术支持哈尔滨银行

由于每个供应商检查的数据块大小各不相同。一些供应商固定数据块的大小，一些则使用不同大小的块(有一些甚至允许终端用户改变固定块的大小，这会令人更加困惑)。固定块的大小可能为8 KB或64 KB，区别在于块越小，被判定为冗余的几率越大。这也就意味着消除的冗余更多，存储的数据更少。固定块只存在一个问题：如果文件发生变化，而重复数据删除产品依然利用上次检查到的固定块，那就可能无法监测冗余部分，因为文件中的数据块已被改变或移除，而利用的固定块仍是变化之前的，剩下的比较就没有意义了。

　　各种规模的块能够提高普通冗余的监测几率，尤其是在文件发生变化以后。这种方法能够监测文件中可能发生的实样模或断点，从而分割数据。即使文件变化，数据块被转移，这种方法也能发现重复的数据。不足之处呢？这种方法能改变块大小，需要供应商追踪并比较多个ID，因此会影响增大规模、增加计算时间。

收起

互联网服务 · 2016-01-21

查看赞同的人

lzg21st
NB!专业，回头好好研究下
2016-01-21
赞同
评论

添加评论

lzg21st存储工程师brcb

重删近年来也是异常火爆的入门技术，其原理大多都是给数据切片，形成指纹，同样的指纹进行dedup，不一样的落盘，显然确实会节省空间，但是对于数据源的特性，去重比也是千差万别，在备份领域，一般像虚机，我们这边用DD4200，去重比高达10倍左右，而数据库应用去重比要低很多，这也合情合理。现在SVC貌似也在考虑融入去重的技术，我们可以关注一把。

收起

银行 · 2016-01-21

查看赞同的人

sxtycxx 解决方案经理人工智能（计算机视觉）

重删确实是一种比较实用的技术，而且效果也比较明显，像好多厂商宣传的10:1、8:1的重删比例，但是在使用重删不当的情况下，也会严重影响性能和带宽：

重删分为源端和目标端、在线和后处理等几种方式，针对备份大多是目标端的后处理方式，这样不会影响生产业务的性能，但是重删功能不仅是备份中使用，生产的数据中心也在使用，此时如果使用不当就会严重影响性能，例如重删可以基于块或是文件类型进行重删，针对块的重删，因为经过重删后，原有的数据被打散（原有的数据被非重复数据+重复数据的逻辑地址映射等关系），如果应用是多读多写类型的，很对读IO类型，这样就会带来性能影响，因为在读数据的时候，存储软件需要进行大量的数据拼接的结算，如果数据量非常大，这样就不太好了，

所以，重删并不适合所有的应用，至少多读和大数据块以及文件类型的应用不太适合

收起

互联网服务 · 2016-01-21

查看赞同的人