公有云环境下科学工作流调度问题的研究

皮尔森相关性论文 NSGAII论文 正交实验设计论文 模拟二进制交叉论文
论文详情
公有云环境向用户提供了大量可租用的资源,例如不同性能的虚拟机、不同带宽的网络和不同的存储容量。科学工作流是由一系列计算任务组成,来完成一些科学计算目标的任务集合。科学工作流已经被广泛应用在天文学、物理学、地球科学、神经科学等领域。公有云环境下工作流调度问题是研究如何将工作流中的任务合理分配到租用的虚拟机上。这个问题通常被建模成一个优化问题。现在已经提出了许多单目标或多目标优化算法来解决工作流调度问题。但是根据我们对现有研究的总结,优化目标之间的冲突度还没有被研究。在本文中,我们使用皮尔森相关系数来对优化目标之间的冲突度进行度量。然后提出了一个基于非支配排序遗传算法(NSGAII)和正交实验设计方法(OD)的多目标优化算法ONSGAII来解决工作流调度问题。基于上述背景和问题,首先,本文对从2007年云计算概念提出至今所有有关公有云计算环境下科学工作流调度的文章进行了综述,并总结出六个优化目标,分别为执行时间、总花费、虚拟机数量、资源利用率、计算花费、数据传输花费。文中列出了部分文章,其中9篇单目标优化文章,10篇多目标优化文章。之后,本文对科学工作流调度问题进行数学建模。具体来说,分别对工作流、云计算环境和六个优化目标进行了建模。在对六个优化目标建模前,本文介绍了云资源共享的概念,并举例说明了资源共享的规则。对于六个优化目标,本文给出了各自的计算公式和部分计算伪代码。其次,本文在解空间上通过计算皮尔森相关系数分析了六个优化目标之间的冲突度。分析过程中使用正交实验设计方法降低了解空间的规模。我们将结果用灰度图进行表示,图中颜色越深表明两个优化目标之间冲突度越大,反之,冲突度越小。我们在11个现实科学工作流上进行了分析,结果表明执行时间和总花费之间冲突度最大。最后,本文提出了一个解决公有云环境下科学工作流调度问题的算法ONSGAII。在选择优化目标时,考虑到执行时间和总花费之间冲突度最大,并且现有研究主要优化这两个目标,我们选择执行时间和总花费作为优化目标。本算法基于传统的NSGAII算法和正交实验设计方法,在NSGAII算法基础上改进了初始化种群过程和交叉算子。在初始化过程中,为了避免解的分布太集中,我们使用正交实验设计的方法构造初始种群,使得初始种群能够具有均匀广泛的分布性。在改进交叉算子时,我们提出了一个基于距离的模拟二进制交叉算子。为了验证算法的性能,我们将ONSGAII算法与三个启发式算法(NSGAII、GA、PSO)、两个构造型算法(HEFT、Min-min)进行比较。首先我们分析了四个启发式算法的收敛性,结果表明本算法能快速产生最优解集。其次,我们分析了六个算法的最优解分布,结果表明本算法产生的最优解集优于其他五个算法。11个现实科学工作流上的实验结果都表明了本算法能够快速产生出较优的最优解集。
ABSTRACT第5-6页
摘要第7-12页
List of Symbols第12-13页
List of Abbreviations第13-17页
Chapter 1 Introduction第17-25页
    1.1 Backgroud第17-19页
    1.2 Related Work第19-21页
        1.2.1 Single-objective algorithms第19-20页
        1.2.2 Multiple-objective algorithms第20-21页
    1.3 Main Content第21-22页
    1.4 Thesis Structure第22-25页
Chapter 2 Related Theory and Techniques第25-31页
    2.1 Pearson Correlation Coefficients第25-26页
    2.2 Orthogonal Design Method第26-28页
    2.3 NSGAII第28-29页
    2.4 Chapter Summary第29-31页
Chapter 3 Mathematical Models and Problem Formulation第31-47页
    3.1 Workflow Model第31-33页
    3.2 System Model第33-35页
    3.3 Objective Functions Model第35-46页
        3.3.1 An Example of Resource Share第38-40页
        3.3.2 Execution Time (ET)第40-44页
        3.3.3 Monetary Cost (MC)第44-45页
        3.3.4 Number of Virtual Machines (NVM)第45页
        3.3.5 Resource Utilization (RU)第45页
        3.3.6 Execution Cost (EC)第45页
        3.3.7 Data Transfer Cost (DTC)第45-46页
    3.4 Scientific Workflow Scheduling第46页
    3.5 Chapter Summary第46-47页
Chapter 4 Analysis on Correlations of Objective Functions第47-59页
    4.1 Datasets第47-49页
        4.1.1 Workflow Dataset第47-48页
        4.1.2 System Dataset第48-49页
    4.2 Analysis on Solution Space第49-51页
    4.3 Objective Correlations第51-54页
    4.4 Experiment Results第54-57页
    4.5 Chapter Summary第57-59页
Chapter 5 The Design and Implementation of ONSGAII Algorithm第59-81页
    5.1 Objective Functions Selection第59页
    5.2 Problem Definition第59-60页
    5.3 Design and Implementation of ONSGAII Algorithm第60-70页
        5.3.1 Encoding第61-62页
        5.3.2 Initialization第62-64页
        5.3.3 Fast Non-dominated Sort第64页
        5.3.4 Selection第64页
        5.3.5 Crossover第64-69页
        5.3.6 Mutation第69-70页
        5.3.7 Save Optimal Individuals第70页
    5.4 Experiments第70-79页
        5.4.1 Experiment Setup第70页
        5.4.2 Control Parameters第70-72页
        5.4.3 Experiment Results and Analysis第72-79页
    5.5 Chapter Summary第79-81页
Chapter 6 Conclusion and Future Work第81-83页
    6.1 Conclusion第81-82页
    6.2 Future Work第82-83页
Appendix A Additional Experimental Results第83-93页
    A.1 Researches of Related Work第83-84页
    A.2 Correlations of Objective Functions第84-87页
    A.3 Analysis of Algorithms第87-93页
        A.3.1 The Convergence of Algorithms第87-90页
        A.3.2 The Optimal Solutions of Algorithms第90-93页
References第93-97页
Acknowledgements第97-98页
Author Information第98-99页
论文购买
论文编号ABS3089904,这篇论文共99页
会员购买按0.30元/页下载,共需支付29.7
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付49.5
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656