重复数据删除技术在云存储中的应用与实现
分块算法论文 重复数据删除论文 指纹库论文 分布式系统论文
论文详情
随着电子信息科技和互联网产业的高速发展,企业和个人产生了大量的数据,并且其中重要的数据需要安全存储,云存储技术很好的解决了这个难题。然而,在这些备份的数据中有大量都是冗余的,这些冗余数据的存储和传输浪费了大量的存储成本和网络带宽。针对这些问题,设计了一种高效的重复数据删除系统来减少重复数据的存储和网络传输首先针对常见的文件类型,为不同数据类型的文件提出了不同的分块算法,尤其是针对文档类文件,设计了一种改进的滑动窗口算法,通过牺牲少量重删率,但使得性能获得巨大提升;其次提出了一种分布式的系统来分治指纹库和实现数据的并行处理,该系统由1台Nameserver和多台Dataservers组成,Nameserver管理用户文件地址表信息,Dataserver管理该节点的指纹库和数据存储,对于用户文件地址表的索引提出了一种高效的索引结构;最后设计了一种高性能的具有三层过滤、判重结构的指纹库,进一步地提升了系统的性能。针对系统进行了相关测试。首先,对改进的滑动窗口算法进行了测试,结果表明,该算法相对于滑动窗口算法在损失少于10%重删率的基础上,使性能最高提升了30倍左右。其次,针对分布式系统的性能进行了测试,结果表明,数据节点数量增加到4台情况下,系统的吞吐率也得到了相应的提升3.12倍。最后,测试了单机情况下,有重删和无重删备份和恢复性能的对比,结果表明该系统的吞吐率是无重删系统的67%以上。
摘要 | 第4-5页 |
Abstract | 第5页 |
1 绪论 | 第8-13页 |
1.1 课题研究背景 | 第8-9页 |
1.2 重删技术的国内外研究现状 | 第9-11页 |
1.3 课题来源 | 第11-12页 |
1.4 主要研究内容与章节安排 | 第12-13页 |
2 重复数据删除关键技术 | 第13-22页 |
2.1 重删基本原理 | 第13-14页 |
2.2 重复数据检测技术 | 第14-19页 |
2.3 指纹计算 | 第19-20页 |
2.4 指纹查询 | 第20-21页 |
2.5 本章小结 | 第21-22页 |
3 重删系统整体设计 | 第22-38页 |
3.1 系统设计背景 | 第22-23页 |
3.2 系统架构 | 第23页 |
3.3 功能模块 | 第23-35页 |
3.4 系统数据分配策略 | 第35-37页 |
3.5 本章小结 | 第37-38页 |
4 重删系统详细设计 | 第38-46页 |
4.1 系统读写流程描述 | 第38-40页 |
4.2 分块算法模块 | 第40-41页 |
4.3 文件路径索引和地址表模块 | 第41-43页 |
4.4 指纹库模块 | 第43-45页 |
4.5 本章小结 | 第45-46页 |
5 测试结果和分析 | 第46-52页 |
5.1 测试环境 | 第46页 |
5.2 测试结果和分析 | 第46-51页 |
5.3 本章小结 | 第51-52页 |
6 总结和展望 | 第52-54页 |
6.1 总结 | 第52-53页 |
6.2 展望 | 第53-54页 |
致谢 | 第54-55页 |
参考文献 | 第55-58页 |
论文购买
论文编号
ABS4297425,这篇论文共58页
会员购买按0.30元/页下载,共需支付
17.4。
不是会员,
注册会员!
会员更优惠
充值送钱!
直接购买按0.5元/页下载,共需要支付
29。
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文