重复数据删除技术在云存储中的应用与实现

分块算法论文 重复数据删除论文 指纹库论文 分布式系统论文
论文详情
随着电子信息科技和互联网产业的高速发展,企业和个人产生了大量的数据,并且其中重要的数据需要安全存储,云存储技术很好的解决了这个难题。然而,在这些备份的数据中有大量都是冗余的,这些冗余数据的存储和传输浪费了大量的存储成本和网络带宽。针对这些问题,设计了一种高效的重复数据删除系统来减少重复数据的存储和网络传输首先针对常见的文件类型,为不同数据类型的文件提出了不同的分块算法,尤其是针对文档类文件,设计了一种改进的滑动窗口算法,通过牺牲少量重删率,但使得性能获得巨大提升;其次提出了一种分布式的系统来分治指纹库和实现数据的并行处理,该系统由1台Nameserver和多台Dataservers组成,Nameserver管理用户文件地址表信息,Dataserver管理该节点的指纹库和数据存储,对于用户文件地址表的索引提出了一种高效的索引结构;最后设计了一种高性能的具有三层过滤、判重结构的指纹库,进一步地提升了系统的性能。针对系统进行了相关测试。首先,对改进的滑动窗口算法进行了测试,结果表明,该算法相对于滑动窗口算法在损失少于10%重删率的基础上,使性能最高提升了30倍左右。其次,针对分布式系统的性能进行了测试,结果表明,数据节点数量增加到4台情况下,系统的吞吐率也得到了相应的提升3.12倍。最后,测试了单机情况下,有重删和无重删备份和恢复性能的对比,结果表明该系统的吞吐率是无重删系统的67%以上。
摘要第4-5页
Abstract第5页
1 绪论第8-13页
    1.1 课题研究背景第8-9页
    1.2 重删技术的国内外研究现状第9-11页
    1.3 课题来源第11-12页
    1.4 主要研究内容与章节安排第12-13页
2 重复数据删除关键技术第13-22页
    2.1 重删基本原理第13-14页
    2.2 重复数据检测技术第14-19页
    2.3 指纹计算第19-20页
    2.4 指纹查询第20-21页
    2.5 本章小结第21-22页
3 重删系统整体设计第22-38页
    3.1 系统设计背景第22-23页
    3.2 系统架构第23页
    3.3 功能模块第23-35页
    3.4 系统数据分配策略第35-37页
    3.5 本章小结第37-38页
4 重删系统详细设计第38-46页
    4.1 系统读写流程描述第38-40页
    4.2 分块算法模块第40-41页
    4.3 文件路径索引和地址表模块第41-43页
    4.4 指纹库模块第43-45页
    4.5 本章小结第45-46页
5 测试结果和分析第46-52页
    5.1 测试环境第46页
    5.2 测试结果和分析第46-51页
    5.3 本章小结第51-52页
6 总结和展望第52-54页
    6.1 总结第52-53页
    6.2 展望第53-54页
致谢第54-55页
参考文献第55-58页
论文购买
论文编号ABS4297425,这篇论文共58页
会员购买按0.30元/页下载,共需支付17.4
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付29
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656