集群计算机系统进程迁移实现机制研究

一、群机系统中进程迁移实现机制的研究（论文文献综述）

胡维^[1]（2017）在《面向超级计算机的故障预测和容错关键技术研究》文中指出大规模科学计算需求的不断增长推动着超级计算机系统快速发展。随着系统规模的增大,其组成部件不断增加、软硬件结构日益复杂、工作模式快速变化,超级计算机系统平均无故障时间越来越短,可靠性问题日益突出。现有容错技术由于效率不高,已经无法适应超级计算机系统规模和并行应用规模快速增长的需要。本文针对超级计算机系统面临的可靠性挑战,以提高大规模并行应用在系统频繁故障环境下的运行效率为目标,对主动容错和被动容错相结合的容错技术展开一系列研究,取得了如下创新成果:1.提出了用于故障预测的数据采集方法——DDC针对现有数据采集方法数据属性采集不全,数据传输和保存开销大的问题,我们面向未来Exascale超级计算机提出了分布式数据采集方法DDC。该方法在数据采集过程中,将轻量级进程分散在各个采集结点上,不仅使得数据采集开销小、灵敏度高,而且能够充分满足实时性的要求。在数据汇集方面,我们首先提出了一种多层分组数据汇集方法,该方法不仅能够保证获取结点故障前的关键状态数据,而且可以有效利用高速互连网络资源以节省I/O资源消耗。为进一步降低数据汇集开销,在多层分组汇集方法的基础上,我们又提出了环形数据汇集方法,将计算结点按照一定规则分组,以组为单位组内结点采用类似环形链表的方式进行组织,仅传输故障结点故障前固定时长的状态数据和部分正常结点的状态数据,进一步减少了网络和存储开销。实验结果表明,DDC数据采集方法避免了大量无效数据的传输,数据采集开销小,实时性好,且同时具备良好的可扩展性,可满足在系统规模不断扩大的情况下进行故障预测数据采集的需要。2.提出了基于属性选择和集成数据流挖掘的在线故障预测技术——FSoE针对现有超级计算机故障预测方法准确率低,无法满足大规模系统主动容错需要的情况,本文提出了基于属性选择和集成数据流挖掘的在线故障预测方法FSoE。FSoE包括两部分功能,数据属性选择和在线故障预测。首先,我们提出了FSFW数据属性选择方法,在对DDC采集到的原始数据除冗去噪的基础上,采用过滤式和封装式相结合的方式进行数据属性选择,过滤式方法将互信息和距离度量相结合对数据属性进行类别相关度排序,封装式方法以SVM分类器精度作为评价指标,在过滤式属性排序的基础上,完成属性子集的快速选择。其次,在数据属性选择的基础上,我们提出在线集成数据流挖掘预测方法GAE,该方法以SVM作为基分类器,采用基于分类相似度的分组方法组成最优分类器子集进行实时结点样本状态分类,并采用移动窗口方法预测结点的未来运行状态。实验结果表明,经过FSFW属性选择,分类器分类精度有效提升。采用GAE集成数据流挖掘预测方法与现有典型集成预测方法相比具有更高的预测精度。通过基于结点硬件环境状态数据和系统运行状态数据双数据源的FSoE预测系统的叠加预测,取得了良好的结点故障预测效果。3.提出了主动容错和被动容错相结合的容错方法——FTRP当前并行计算系统规模不断增大,故障发生频度逐渐增加,针对现有被动容错方法容错开销较大,严重影响了并行应用运行性能和可扩展性的问题,本文提出了一种新的主动容错和被动容错相结合的容错框架FTRP。FTRP通过建立WM开销模型,并借助故障预测结果,可自适应选择容错机制,从而能够最大限度减少故障对应用运行的影响。基于对超级计算机运行的观察、分析和实验,我们发现了超级计算机故障局部性特性,并基于该特性提出了一种新的容错方法PRP2。PRP2方法不仅提供进程复制机制,而且提供进程预取机制,因而不仅能够保护被正确预测出即将故障的结点上的进程,而且能够对未被预测出的故障结点的进程提供预取保护机制,因此能够从更大程度上避免故障结点的影响,提高主动容错的效率。FTRP提供了主动容错和被动容错互补结合的新模式,能够有效利用主动容错和被动容错机制的优点,并避免各自缺陷,提高在故障频发情况下大规模并行系统的应用运行性能。基于实际系统故障trace的模拟实验结果显示,FTRP框架显着优于现有主要的容错机制。4.提出了基于存储受限加速比和存储墙的checkpointing容错技术可扩展性分析模型Checkpointing技术是目前使用最为广泛的超级计算机容错技术,但频繁的checkpoint保存操作会带来巨大的I/O开销,特别是未来Exascale级计算需求下,checkpointing开销会对大规模并行应用的性能和可扩展性产生严重的束缚。本文从可扩展性的角度,重点度量checkpointing技术的数据保存开销对应用可扩展性的影响。我们在对checkpointing机制带来的I/O开销进行分析的基础上,提出存储受限加速比和存储墙模型,该模型从存储性能的角度对并行应用的可扩展性进行定量建模,并分析了在不同存储系统结构下的并行应用存储墙特性,最后基于天河-1A（TH-1A）和美洲虎（Jaguar）超级计算机进行实验和分析,利用存储受限加速比和存储墙模型定量揭示了checkpointing技术对并行应用可扩展性的影响,验证了checkpointing技术的关键因素对并行应用可扩展性的影响特性,实验结论对主动容错和被动容错相结合的容错技术研究提供了有益的指导。

马海银^[2]（2013）在《智能集群渲染管理软件分析与设计》文中研究指明随着数字媒体产业的不断发展,越来越多的数字呈现从传统的二维动画上升到三维动画。在给观众以良好的视觉体验的同时,也增加了渲染计算的时间。为了解决这一问题集群渲染成为渲染行业的主流渲染方式。智能集群渲染管理系统是为渲染农场高效管理计算资源,充分发挥集群计算优势的系统。它可以适应不同用户的需求,根据自身的调度算法智能的分配渲染农场中的计算资源,提高整个系统的利用效率。本文在分析了国内外集群渲染的发展现状基础上,描述了系统需要解决的主要问题。通过对当前渲染农场的主要业务流程进行深入的需求分析明确了系统的重大约束,在架构设计上采用4+1视图对系统的构架进行了多视角的阐述,并在详细设计中描述了调度机制的关键算法,最后简单呈现了系统的实现和测试。本软件采用传统的瀑布模型为软件开发方法,以统一建模语言（UML）为分析设计描述语言,对智能集群渲染管理系统进行需求分析、架构设计和详细设计。本文解决的主要问题1、研究并实现渲染过程中的调度问题,在调度过程中采用负载均衡机制确保系统效率2、研究并实现系统容灾方案3、按照统一建模语言进行系统的需求分析和架构设计,在需求分析过程中通过ADMEMS矩阵方法确定系统约束,在架构设计过程中通过4+1视图多角度描述系统

黄煜^[3]（2012）在《KVM虚拟机CPU虚拟化的研究与调度策略的优化》文中研究指明由于能够有效地提高计算机资源的利用率，以及应用上的灵活性、安全性和可扩展性，虚拟化技术逐渐成为计算机技术研究和应用方面的热门领域。随着虚拟化技术的发展，主流的硬件厂商Intel和AMD公司提出了新的支持虚拟化技术的硬件架构，使虚拟化技术有了巨大的飞跃。在硬件支持下的虚拟化技术，进一步提高了虚拟化环境下虚拟机的整体性能，并且由于这项技术具有显着的优越性，因此在Linux操作系统中也得到了支持和应用。本文的研究对象是支持硬件辅助虚拟化技术的KVM虚拟化方案，从Linux2.6.20版本开始，该方案已经被集成到Linux内核中。Intel VT技术是Intel平台上硬件辅助虚拟化技术的总称，该项技术提供了包含CPU、内存、I/O设备等各方面虚拟化支持的一整套虚拟化方案。本文在分析传统的CPU虚拟化技术的基础上，重点对Intel VT技术下的CPU虚拟化技术——VT-x的机制和原理进行了深入的研究。详细地分析了VT-x技术下VMX根操作模式和非根操作模式的特点，以及虚拟化技术在两种模式下的应用。在对VT-x技术研究的基础上，本文根据KVM虚拟化方案的两大特点—Linux模块化和QEMU设备化，深入研究和分析了KVM虚拟机的虚拟CPU的实现机制和运行流程，以及QEMU模拟器通过ioctl功能进入/退出虚拟机机制，设计并验证了一套异常捕捉方法的方案，为进一步提高虚拟机的整体性能提供了一条有效途径。根据KVM虚拟化方案特点，本文继续深入研究和分析了KVM虚拟机的进程模型，并设计和实现了一套KVM虚拟机处理器调度优化方案。该优化方案主要包括三个部分：调度策略、运行优先级和客户机操作系统的隔离。进而实现KVM虚拟机的个性化，即不同的虚拟机可以拥有不同的优先级和调度策略，以及运行在不同的CPU上，并在整个运行期间不发生迁移。通过使KVM虚拟机对CPU拥有更高的优先权，以及减少KVM虚拟机运行期间在CPU之间的切换开销，实现提高KVM虚拟机性能的目标。本文通过KVM虚拟机异常捕捉实验，实现了对KVM方案下客户机异常的分类处理，从而验证了KVM虚拟机异常捕捉方案的可行性。通过虚拟机调度策略实验，客户机绑定实验，以及UnixBench的综合测试，证实了本文研究的调度优化方案使虚拟机的性能有了一定的提高。因此，该方案的实现不仅可以满足用户对虚拟机的功能需求，还能进一步提高虚拟机的整体性能，具有一定的实用价值。

钟新玉^[4]（2011）在《图像检索的并行计算方法与系统》文中研究指明随着计算机技术、多媒体技术以及通讯技术的飞速发展,多媒体信息迅速成为信息交流与服务的主流。基于内容的网络图像检索系统具有重要的应用价值,但其计算效率尚不能满足处理海量网络图像的要求。并行计算是解决该问题的有效途径之一。为了达到快速高效处理图像的目的,本课题深入研究了图像检索并行计算系统中的关键技术:任务平衡调度和负载均衡调度。任务调度是将系统中的多任务合理地分布在不同的计算机结点上运行,使任务尽可能地并行执行,以减少总的执行时间,提高系统的运行效率。负载调度是将重负载计算机结点上的作业转移到轻负载结点上执行,使所有结点上的负载趋向均等。为了有效地进行任务平衡调度和负载均衡调度,系统周期性地侦测结点状态的变化,根据系统结点状态的变化,系统动态地调整结点任务。引入了服务器结点负载冗余值,可以有效预测当前各个结点的剩余的计算能力以及系统总的剩余计算资源,有效避免服务器结点负载过量的问题以及任务间数据处理能力不一致的不足。本文对任务平衡调度方法进行了深入研究,提出了一种基于数据驱动的负载冗余任务平衡调度方法,其分配依据是任务平衡程度,具体通过任务在一个调度周期时间内处理图像数据的平均速度来进行度量。实验结果显示任务平衡调度算法是有效的;结合当前负载均衡的算法分析和比较,提出了一种融合多种资源的自适应动态负载均衡调度方法,其具体流程是周期性地侦测系统结点负载变化以及系统结点计算资源的改变,根据结点负载状态和系统结点计算能力,动态均衡各个结点的负载。实验结果显示负载指标趋于均衡,证明了负载均衡调度方法是可行的。在此基础上,实现了一个具有硬件自适应能力的互联网图像检索并行计算调度系统。最后给出实验结果,结果显示一台和两台计算机并行处理10000幅图像数据的加速比分别为1.30和1.80,系统图像数据处理时间明显减少,因此,系统调度方法是有效的。

申思^[5]（2011）在《多机环境下进程迁移技术的实现与应用》文中研究指明随着现代计算机技术的发展,计算机系统的性能不断提高,价格却不断下降,使得基于集群的分布式系统在扩展性和性价比方面的优势愈发明显。同时,各领域对高性能计算的需求使集群系统的应用越来越广泛。为了更加有效的利用集群中的计算资源,维持集群的负载平衡,保障计算任务正确执行,需要使用进程迁移技术。特别是在基于个人工作站的多机环境中,各计算节点不是专用的且不一定是同构系统。当工作站使用者需要收回私有的计算资源或者集群的负载不平衡时,需要将计算任务迁移到新的节点继续执行,并保留已完成的工作量,还要尽可能实现迁移的平台无关性。本文主要讨论适用于普通多机环境的进程迁移技术,并将其应用于图像处理领域。传统的进程迁移系统一般依赖于特殊的软硬件环境,本文根据普通多机环境的特点,选择Java平台实现进程迁移,满足了跨平台的要求。进程迁移不仅要迁移原始代码,还要迁移进程在中断点的状态信息。如何捕获和恢复进程的状态数据,是研究进程迁移技术的核心内容。本文根据Java体系结构的特点,采用基于JPDA和修改字节码的方法实现进程迁移。进程状态的捕获通过JPDA实现。进程状态的恢复是本文的难点。恢复进程时,要使程序跳转到断点处继续执行,但是有些变量声明语句不能跳过,而通过JPDA只能查看和修改进程的数据,不能声明对象,也不能改变程序的运行流程。因此本文使用了字节码修改技术,改变程序运行流程,解决了这些问题。此外,为保存和传输与进程有关的信息,本文采用了检查点机制。首先设计了一系列特殊的类来存储进程外部数据（如源代码）和某一时刻的进程状态信息。其次,由于进程迁移发生的时间不确定,结合多机环境的特点,本文采用了以时间为标准的检查点控制策略,动态的启用检查点,捕获和保存进程信息。通过编写验证程序,证明本文所述的基于JPDA和字节码的进程迁移技术是可行的。最后,实现了一个原型系统JMigrate,测试表明其在图像处理计算中有良好的性能和较高的可用性。

马俊^[6]（2011）在《面向内部威胁的数据泄漏防护关键技术研究》文中提出随着信息网络的快速发展,数据信息的应用环境越来越复杂,数据在从创建、存储、使用、共享、归档到销毁的生命周期各个阶段都面临各种泄漏风险,特别是由内部威胁导致的数据泄漏问题日益突出。传统的数据泄漏防护技术可以有效抵御来自外部的攻击,但对于内部威胁还缺乏有效的防护。而且这些技术多是针对数据生命周期某个阶段的防护需求建立相应的防护机制,没有形成统一的有机整体,一旦某个环节出现问题,将导致整个泄漏防护失败。分布式和云计算技术的广泛应用给数据泄漏防护提出了许多新的挑战。如何有效应对内部威胁导致的数据泄漏,建立支持数据全生命周期的统一防护机制,确保数据在存储、使用和共享传输过程中的安全,是当前信息安全领域亟待解决的关键问题。本文分析了数据生命周期各个阶段的泄漏防护需求,并针对内部威胁的特点,从增强数据自身防护能力的角度出发,提出了一种面向内部威胁的数据泄漏主动防护模型。基于该模型,本文分别从信息流约束、可信主体的隔离约束以及主动防护体系结构等方面深入研究了数据泄漏防护的理论和技术。通过对关键技术的集成,设计实现了一款具有主动防护能力的安全移动存储器,验证了模型的正确性和防护技术的有效性。本文取得的主要研究成果如下:1.提出了一种面向内部威胁的数据泄漏主动防护模型。该模型通过对数据本身或数据存储环境进行属性和安全机制扩展,为数据增加具有自主安全防护能力的安全数据容器（Secure Data Container, SDC）,由安全容器在数据生命周期的各个阶段主动对使用环境进行可信检测,并对数据使用过程进行安全控制,从而实现对数据的“贴身保护”。同时,针对内部威胁的特点,给出了数据泄漏主动防护模型的实现框架,为本文关键技术的研究提供总体的思想和结构指导。2.提出了一种基于单向信息流约束的主动中国墙模型。该模型针对数据泄漏防护中信息流约束的特点和需求,对传统中国墙模型的冲突关系和联盟关系进行了扩展,提出了主动冲突关系和主动联盟关系的概念。在此基础上,给出了模型的形式化描述和安全特性分析,并与传统中国墙模型以及BLP模型等进行了比较和分析,最后给出了模型在访问控制、终端电子文档泄漏防护和虚拟机环境泄漏防护等不同应用场景下的实现结构。3.提出了一种面向可信主体约束的动态隔离机制。该机制根据数据泄漏防护的需求划分隔离域,并针对可信主体的不同访问操作,通过读隔离、写隔离和通信隔离等三种隔离过程动态扩展隔离域范围,在保证可信主体应用完整性的同时,防止其通过“合法操作”导致的数据泄漏。给出了隔离过程中文件和进程迁移的实施策略,并使用形式化方法对动态隔离机制的安全性进行了描述和证明。在此基础上,通过扩展不同隔离域之间的引用关联,实现了一种动态隔离增强的轻量级虚拟机DI-FVM。DI-FVM在操作系统层进行虚拟化,通过引用关联来实现细粒度的行为约束。4.提出了一种基于使用预期的主动安全存储结构。从数据角度出发,根据数据在不同状态下对属性、访问操作以及使用环境的安全预期,建立统一的安全需求描述机制,提出了基于预期的使用控制模型。在此基础上,重点研究了数据从存储设备到使用环境的连续保护问题,提出了一种基于使用预期的主动安全存储体系结构（Usage-Expectation-based Active Secure Storage, UE-ASS）。UE-ASS将主动防护机制绑定到存储设备中,通过在终端系统中动态构建虚拟隔离使用环境,并基于可信计算建立从存储设备到隔离环境的信任链,实现数据使用预期的可信传递和使用过程的连续控制。5.以主动泄漏防护模型为指导,综合上述关键技术成果,设计实现了一款具有主动防护能力的安全移动存储器UTrustDisk。该存储器将嵌入式安全芯片集成到存储器硬件中,并通过安全芯片上运行的片上操作系统（Chip Operating System,COS）实现存储器的主动防护。COS会在终端系统中动态构建数据使用的虚拟隔离环境DI-FVM,并基于安全芯片提供的安全机制实现信任链的建立和数据使用预期的管理,从而确保数据从存储设备到使用环境过程中的主动泄漏防护。以上研究成果综合考虑了内部威胁的特点和数据整个生命周期内的泄漏防护需求,以信息流分析方法为基础,结合虚拟隔离和可信计算的思想,通过增强数据自身的主动防护能力,实现数据全生命周期的连续泄漏防护。对信息流约束和动态隔离机制的形式化验证表明,本文的方法可以有效保证泄漏防护的安全性,具有一定的理论意义。原型系统的实现和测试也表明,以上泄漏防护技术可以较好的解决内部威胁导致的数据泄漏问题,为实际应用中的泄漏防护提供了重要的技术支撑,具有很好的实用价值。

陈帆^[7]（2011）在《远程实时图形渲染系统的研究与实现》文中指出随着计算机图形学与虚拟现实技术的应用范围越来越广泛,三维场景的规模在不断增大的同时场景内容也变得更复杂,使得利用单台普通PC机实时绘制大规模的三维场景不但会造成时间瓶颈,而且实时渲染性能和输出分辨率的效果也很差。本文依托国家高技术研究发展计划（863计划）的面向行业/领域的IT资源库关键技术及系统,设计实现的远程实时图形渲染系统很好地解决了上述问题。该系统遵循公共对象请求代理体系（CORBA）规范,使用集群渲染技术支持多个客户同时独立地进行三维场景的渲染。这种系统不但实时渲染性能高,而且成本比较低,可扩展性强,有很好的应用前途。本文首先介绍了远程实时图形渲染系统的相关技术:主要包括本文系统使用的三维图形渲染引擎Romans、集群技术、负载均衡技术和动态迁移技术等。本文随后对远程实时图形渲染系统进行总体设计,包括对整个系统的框架结构设计和系统各个主要模块的设计。随后重点设计出远程实时图形渲染系统中负载均衡算法和动态迁移算法。本文基于对LVS集群常用负载均衡调度策略的研究,针对场景渲染应用的特殊性提出了一种基于负反馈控制的负载均衡算法。本文接着深入地研究了远程实时图形渲染系统的实现细节。设计并实现了渲染服务器程序,主要侧重于多线程的并发处理。随后实现了负载均衡算法中负载信息的计算、服务器权值的计算这些重点环节。最后实现了动态迁移算法的若干关键问题。本文搭建了远程实时图形渲染系统的测试环境,对系统实际的渲染效果和测试的数据进行了简要的分析,从中可以看出本文设计实现的系统具有较好的实时渲染性能、较高的吞吐量和很好的稳定性,能满足应用的需求。本文最后总结了本课题的工作,并且指出了以后研究工作的主要方向。

卢旭^[8]（2011）在《面向分布式关键任务系统的自愈调控技术研究》文中进行了进一步梳理分布式关键任务系统的异构性、复杂性和使用环境动态变化不可避免地导致了系统失效、任务偏离甚至中断运行、崩溃死机等现象发生,造成重大经济损失甚至是人员伤亡等严重后果,这也使得人工完成其管理和恢复、不间断地保持任务运行变得愈加困难。在此种背景下,以自我管理能力为核心研究目标的自律计算逐渐得到了广泛重视,并在多个领域有着深入研究与应用。自愈调控技术是自律计算基础性关键技术之一,面向分布式关键任务系统的自愈调控技术实现了关键任务系统的失效监控与预测、自愈调控策略生成以及关键任务调度等系统设计基础功能,对关键任务运行可靠性和可持续性都有着重要的保障作用。本文针对关键任务系统使命连续性需求,对分布式关键任务系统自愈调控关键技术以及应用展开研究。从自愈调控总体设计原则讨论入手,首先指出自愈调控总体设计中所需要考虑的基本原则,针对自愈调控设计流程给出综合评价指标体系；以此为基础提出自愈调控整体架构并详细阐述了架构设计理念和关键实现技术；围绕关键任务执行的形式化建模问题,采用状态π演算描述关键任务执行与切换语义,并对关键任务执行逻辑进行验证,为后续自愈调控关键技术研究提供了理论上的可行性和合理性保障。自愈调控策略动态生成是分布式关键任务系统自愈调控研究的核心内容。提出了基于策略的自愈调控模式,阐述了自愈调控策略的基本表述形式并给出了自愈调控策略动态管理中策略分类以及化简步骤；针对失效检测机制准确率不高且故障定位难的特点,提出基于部分可观察随机过程（Partially Observable Markov Decision Processes, POMDP）的自愈调控策略更新算法,采用近似迭代方法求解POMDP策略并给出了迭代收敛性的理论分析。仿真实验利用LANL（Los Alamos National Lab）失效数据中恢复策略效果进行统计,然后计算策略求解的迭代与收敛速度并比较了多种类型自愈策略的恢复效果。实验结果表明与固定策略相比,POMDP策略在不准确失效检测下迭代速度更快且恢复时间更短。自愈调控数据分析与预测是实现分布式关键任务系统失效自愈的必要条件。针对非线性相关失效数据所具有的高维、稀疏等特征,首先提出了非线性相关失效事件联合聚类算法,以互信息熵损失差作为度量标准并从理论上分析算法有限次迭代收敛性；然后针对数值型失效数据采用有监督局部线性嵌入算法进行数据降维,通过失效模式识别实现失效提前预判。实验首先比较了不同算法在失效数据集上的聚类效果和收敛速度,然后采集了故障态与正常态下系统状态指标数据并进行预测性能分析。实验结果表明,所提出的非线性相关失效数据分析方法能够有效聚类出失效数据对象,基于局部线性嵌入的失效预测结果可为主动恢复操作提供决策依据。关键任务自愈调度机制是分布式关键任务系统自愈调控设计与实现的重要保障。针对失效发生随机性以及关键任务运行连续性等特点,采用先调度,后优化的指导思想,提出了基于DAG任务重构迁移的关键任务调度方案。首先重新生成关联任务有向无环图（directed acyclic graph, DAG）,提出DAG动态重构算法将关联任务转化为层次化DAG任务,然后计算关键任务迁移路径并给出可迁移任务死锁避免理论分析,将迁移任务提前调度到当前空闲资源运行,达到缩短任务执行时间的目的。仿真实验测试了三种故障注入类型下任务迁移方案与等待恢复方案的加速比执行性能,实验结果表明任务迁移方案在弹性负载与未知故障情况下具有较好的调度质量,为关键任务系统不间断运行提供合理可行的技术方案。

范光雄^[9]（2010）在《多处理器系统中的线程调度研究》文中指出随着超线程和多核等新兴技术不断涌现,当前的SMP系统硬件结构更加复杂,系统硬件性能也更加强劲,随之而来的问题是:传统的SMP操作系统已不能充分发挥现代SMP硬件系统性能,为了适应当前硬件技术的这种变化,我们有必要在研究传统SMP系统的基础上,对操作系统中那些不适应的部分加以改进或用新的算法替换,从而使软件系统能最大限度地发掘硬件系统的潜在性能。本论文首先介绍了课题研究背景和研究意义,简要阐述了目前在单个处理器物理封装中实现多个进程或线程并行执行的两大主流技术:同时多线程技术（Simultaneous Multi-Threading,SMT）和多核技术（Chip Multi-Processor,CMP）,另外论文还概要介绍了Linux操作系统以及该系统在研究smp系统调度时的重要作用。其次,论文剖析了经典的smp系统组织结构以及各种操作系统中常用的一些经典进程调度算法,这些硬件架构知识和软件概念都为我们后面研究smp操作系统进程调度算法打下了坚实基础。接下来论文将理论联系实际,以最新版本的Linux内核作为研究对象,详细剖析了它的进程调度系统。当前的Linux内核采用了一种全新的名为完全公平调度（Completely Fair Schedule,CFS）的进程调度策略,为了能够理解CFS的调度原理以及它对smp系统的相关支持,论文在详细介绍CFS调度原理的同时,剖析了对应的CFS调度源代码。论文最后章节总结了影响smp调度系统性能的几大关键因素,并分析了我们在设计smp调度系统时应注意的设计要点,以这些理论分析为基础,论文提出了一个高效的smp调度系统模型。在前面章节理论分析的前提下,论文还以一个针对Linux内核的smp系统进程调度优化作为结尾,介绍了我们应当如何对smp调度系统优化进行思考以及在有了优化方案后如何把方案应用于实践并做出实验及验证分析。

赵鑫业^[10]（2009）在《HLA仿真成员动态规划方法及其工具研究》文中研究表明HLA已经成为分布式仿真领域公认的标准化体系结构,但特定联邦约定的FOM限制了重用性和互操作性思想的实现。仿真互操作标准组织在RFOM（参考FOM）的基础上提出了BOM（基本对象模型）的概念,主要解决联邦开发过程中FOM设计所存在的资源重用性较差、工作重复性较多等问题。据此,引出了一种新的联邦开发模式:将基于BOM规范的仿真模型组件规划成具有不同逻辑意义的成员,实现联邦的设计开发,这给仿真系统的灵活组合和规模扩展提供了可能。但随着仿真系统规模的扩大,动态负载平衡问题显得越来越重要。因此,动态调整联邦成员规划对提高基于组件的分布式系统的运行效率,对实现全过程全系统的有效管理有重要意义。论文首先对基于BOM的组件式成员的动态规划方法进行了深入理论研究,归纳了组件式成员的规划原理,总结了成员动态规划对基于HLA分布式仿真系统的意义;其次,论文在成员的动态规划方法研究基础上,设计了仿真动态规划算法。论文提出了一种改进的模拟退火算法,并将其成功应用于仿真任务的分配,同时设计了负载平衡的衡量标准并给出了成员动态规划的调整策略。论文接着深入地研究了成员迁移设计与实现的关键技术,对成员、组件和实体三个级别的迁移实现方法和迁移协议分别进行了理论研究和基本实现。最后,论文根据研究的理论和方法,采用模块化设计思想,实现了成员动态规划的原型支撑工具,并将其应用于空地攻防对抗联邦的设计与开发中。

二、群机系统中进程迁移实现机制的研究（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、群机系统中进程迁移实现机制的研究（论文提纲范文）

（1）面向超级计算机的故障预测和容错关键技术研究（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 课题背景

1.1.1 超级计算机发展现状

1.1.2 面临的可靠性问题

1.2 容错研究基础

1.2.1 容错基本概念

1.2.2 超级计算机系统组成

1.2.3 故障类型

1.2.4 并行系统故障模型

1.3 研究综述

1.3.1 空间冗余容错技术分析

1.3.2 时间冗余容错技术分析

1.3.3 混合冗余容错技术分析

1.4 本文工作

1.5 本文组织结构

第二章面向故障预测的数据采集技术

2.1 引言

2.2 面向故障预测数据采集方法分析

2.2.1 研究目标

2.2.2 相关研究

2.3 分布式数据采集方法DDC

2.3.1 DDC总体设计

2.3.2 硬件环境状态数据采集

2.3.3 系统运行状态数据采集

2.3.4 结点故障事件数据采集

2.4 性能测试与分析

2.4.1 硬件环境状态数据采集开销分析

2.4.2 系统运行状态数据采集开销分析

2.4.3 自适应分组数据汇集开销分析

2.4.4 环形数据汇集开销分析

2.5 小结

第三章基于属性选择和集成数据流挖掘的在线故障预测技术

3.1 引言

3.2 超级计算机故障预测研究基础

3.2.1 超级计算机故障分析

3.2.2 故障预测相关指标

3.3 基于属性选择和在线集成数据流挖掘的故障预测方法FSoE

3.3.1 FSoE总体设计

3.3.2 数据属性选择

3.3.3 基于SVM的集成数据流挖掘故障预测方法

3.4 实验验证

3.4.1 实验设置

3.4.2 数据属性选择有效性验证

3.4.3 集成算法精度比较

3.4.4 集成算法训练时间和预测时间比较

3.4.5 结点预测精度比较

3.5 小结

第四章主动容错和被动容错相结合的容错技术

4.1 引言

4.2 基于进程复制和预取的容错框架FTRP

4.2.1 FTRP总体设计

4.2.2 WM开销模型

4.2.3 进程复制和预取容错机制PRP2

4.3 实验验证

4.3.1 应用运行效率比较

4.3.2 故障预测准确率对效率的影响

4.3.3 PRP2开销对效率的影响

4.3.4 步长变化对效率的影响

4.3.5 应用不同运行规模时效率变化

4.4 相关研究

4.5 小结

第五章 Checkpointing容错技术可扩展性分析

5.1 引言

5.2 Checkpointing存储开销模型

5.2.1 Checkpointing存储开销分析

5.2.2 存储受限加速比模型和存储墙模型

5.2.3 系统分类

5.2.4 系统结构分析

5.3 Checkpointing技术可扩展性实验分析

5.3.1 模型有效性验证实验

5.3.2 Checkpointing技术可扩展性实验

5.3.3 讨论

5.4 相关研究

5.5 小结

第六章总结与展望

6.1 工作总结

6.2 研究展望

致谢

参考文献

作者在学期间取得的学术成果

附录A 存储受限加速比推导

（2）智能集群渲染管理软件分析与设计（论文提纲范文）

摘要

ABSTRACT

第1章绪论

1.1 智能集群渲染管理系统开发背景

1.2 国内外研究现状

1.3 解决的主要问题

1.4 本文的主要工作

1.5 论文的组织结构

第2章智能集群渲染管理系统需求分析

2.1 集群渲染管理系统概述

2.2 集群渲染管理系统设计目标和原则

2.3 集群渲染管理系统需求问题描述

2.3.1 集群渲染管理系统功能性需求

2.3.2 集群渲染管理系统非功能性需求

2.4 需求结构化与约束分析

2.5 确定关键质量与关键功能

第3章集群渲染管理系统架构设计

3.1 系统目标及约束

3.2 概念性架构

3.2.1 体系结构

3.2.2 系统层次描述

3.2.3 重要约束解决方案

3.2.4 初步设计

3.3 细化架构

3.3.1 逻辑架构

3.3.2 开发架构

3.3.3 运行架构

3.3.4 物理架构

3.3.5 数据视图

第4章集群渲染管理系统详细设计

4.1 关键类实现

4.1.1 用户信息类

4.1.2 渲染任务类

4.1.3 渲染节点类

4.1.4 关键类实现

4.2 负载均衡算法

4.2.1 负反馈机制

4.2.2 节点处理能力计算

4.2.3 任务资源消耗量估算

4.2.4 分配机制

4.3 任务动态转移算法设计

4.3.1 迁移过程的启动

4.3.2 渲染节点负载过重时动态迁移的算法流程

4.3.3 渲染节点崩溃时动态迁移的算法流程

4.4 业务层关键代码

4.4.1 控制服务

4.4.2 调度服务

第5章集群渲染管理系统实现与测试

5.1 系统实现

5.1.1 用户客户端

5.1.2 管理员客户端

5.2 系统测试

5.2.1 测试条件

5.2.2 功能测试用例

5.2.3 健壮性测试用例

5.2.4 性能测试用例

5.2.5 可靠性测试用例

第6章结论与展望

参考文献

致谢

附件

（3）KVM虚拟机CPU虚拟化的研究与调度策略的优化（论文提纲范文）

摘要

Abstract

第1章引言

1.1 研究背景

1.2 研究现状

1.3 研究内容

第2章虚拟化技术概述

2.1 虚拟化的概念

2.2 虚拟机监控器

2.2.1 虚拟机监控器的组成

2.2.2 虚拟机监控器的功能

2.3 虚拟化技术介绍

2.3.1 虚拟化技术的分类

2.3.2 KVM 虚拟机

第3章 CPU 虚拟化技术的机制与原理

3.1 传统的 CPU 虚拟化技术

3.1.1 解释执行

3.1.2 扫描与修补

3.1.3 二进制代码翻译

3.2 Intel VT-x 硬件辅助 CPU 虚拟化技术

3.2.1 VT-x CPU 虚拟化技术原理

3.2.2 VT-x 虚拟化技术 VCPU 的实现

第4章 KVM 异常捕捉方法的研究与实现

4.1 KVM 虚拟机的实现原理

4.1.1 VT-x 技术支持下的 KVM 虚拟机架构

4.1.2 KVM 虚拟机的实现机制

4.2 KVM 虚拟机异常机制研究

4.2.1 Linux 异常机制研究

4.2.2 KVM 异常处理流程

4.3 KVM 异常捕捉方案的设计与实现

4.3.1 KVM 异常捕捉方案的设计

4.3.2 KVM 异常捕捉方案的实现

第5章 KVM 虚拟机调度优化方案的设计与实现

5.1 Linux 调度策略研究

5.1.1 Linux 完全公平调度器特点

5.1.2 进程调度策略

5.1.3 进程调度流程

5.2 KVM 虚拟机调度策略研究

5.2.1 KVM 虚拟机调度原理

5.2.2 KVM 进程的调度特点

5.3 KVM 虚拟机调度优化方案的设计与实现

5.3.1 KVM 虚拟机调度优化方案的设计

5.3.2 KVM 虚拟机调度优化方案的实现

5.4 KVM 客户机隔离方案的设计与实现

5.4.1 KVM 客户机隔离方案的设计

5.4.2 KVM 客户机隔离方案的实现

第6章异常捕捉与调度策略优化实验结果及分析

6.1 KVM 虚拟机异常捕捉实验

6.2 KVM 调度策略实验

6.3 KVM 客户机隔离实验

6.4 调度优化方案综合测试

结论

致谢

参考文献

攻读学位期间取得学术成果

（4）图像检索的并行计算方法与系统（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 选题背景和研究的意义

1.2 国内外研究现状与发展趋势

1.2.1 图像检索研究现状

1.2.2 并行计算模型研究现状

1.2.3 图像并行处理

1.3 论文主要工作和内容安排

1.3.1 论文主要工作

1.3.2 论文内容安排

第2章图像检索的并行计算系统

2.1 CBIR典型系统架构

2.2 图像并行计算系统的特点

2.3 系统设计

2.3.1 系统设计的基本原则

2.3.2 系统框架设计

2.3.3 系统中的并行机制

2.4 本章小结

第3章基于数据驱动的负载冗余任务平衡调度算法

3.1 引言

3.1.1 问题描述

3.1.2 当前研究分析

3.1.3 本文思想

3.2 负载信息策略

3.3 任务平衡调度策略

3.4 算法流程

3.5 算法性能与分析

3.5.1 实验设置

3.5.2 实验结果

3.6 本章小结

第4章融合多资源的自适应动态负载均衡调度算法

4.1 引言

4.1.1 问题描述

4.1.2 当前研究现状

4.2 所提出的算法

4.2.1 信息策略

4.2.2 转移策略

4.2.3 选择策略

4.2.4 位置策略

4.2.5 算法流程

4.3 算法性能与分析

4.3.1 实验设置

4.3.2 算法结果

4.4 本章小结

第5章并行检索系统性能实验与分析

5.1 实验介绍

5.2 实验设置

5.3 实验结果与结论

5.4 小结

第6章总结与展望

6.1 总结

6.2 展望

参考文献

附录1 基于数据驱动的负载冗余任务平衡调度程序

附录2 融合多资源的自适应动态负载均衡调度程序

攻读学位期间发表的论文与研究成果

致谢

（5）多机环境下进程迁移技术的实现与应用（论文提纲范文）

摘要

Abstract

第一章绪论

1.1 问题的提出

1.2 研究现状

1.3 目前存在的问题

1.4 论文主要工作

1.5 本文的组织结构

第二章进程迁移原理及实现技术

2.1 进程迁移分类

2.2 进程迁移的步骤

2.3 进程迁移的关键问题

2.4 进程迁移算法

2.5 实现技术

2.5.1 基于虚拟机层的方法

2.5.2 基于代码层的方法

2.5.3 基于JPDA的方法

2.5.4 对比

2.6 小结

第三章基于Java的进程迁移技术

3.1 Java平台

3.1.1 Java体系结构

3.1.2 Java Socket

3.2 JDI功能分析

3.3 基于Java的进程迁移机制

3.3.1 进程状态信息的存储机制

3.3.2 源程序预处理

3.3.3 进程状态的捕获与保存

3.3.4 进程状态的恢复

3.4 可行性验证

3.5 小结

第四章.JMigrate系统的设计与实现

4.1 系统设计

4.1.1 系统需求与设计目标

4.1.2 系统体系结构

4.1.3 系统功能设计

4.1.4 进程迁移流程

4.2 系统实现

4.2.1 预处理

4.2.2 进程状态信息捕获与恢复

4.2.3 Socket 传输

4.2.4 图形界面

4.3 测试

4.3.1 测试环境

4.3.2 测试方法

4.3.3 测试过程

4.3.4 分析

4.4 小结

第五章总结和展望

5.1 总结

5.2 未来工作

参考文献

致谢

附录攻读硕士研究生期间发表的论文

（6）面向内部威胁的数据泄漏防护关键技术研究（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 研究背景

1.1.1 内部威胁导致的数据泄漏问题日益严重

1.1.2 数据泄漏防护技术面临新的挑战

1.2 国内外研究现状

1.2.1 内部威胁防护的研究现状

1.2.2 数据泄漏防护相关理论研究现状

1.2.3 数据泄漏防护技术研究现状

1.2.4 数据泄漏防护技术的新发展

1.3 本文研究内容和主要技术创新

1.3.1 本文主要研究内容

1.3.2 主要技术创新

1.4 论文结构

第二章面向内部威胁的数据泄漏主动防护

2.1 引言

2.2 数据泄漏防护的基本概念

2.2.1 内部威胁

2.2.2 数据泄漏

2.3 典型数据泄漏防护解决方案

2.3.1 内网安全解决方案

2.3.2 可信虚拟域解决方案

2.3.3 可信存储解决方案

2.4 面向内部威胁的数据泄漏主动防护模型

2.4.1 内部威胁的数据泄漏防护需求

2.4.2 数据泄漏主动防护模型

2.4.3 数据泄漏主动防护模型的实现分析

2.5 本章小结

第三章基于单向信息流约束的中国墙模型

3.1 引言

3.2 传统中国墙模型

3.2.1 传统中国墙模型及其改进

3.2.2 传统中国墙模型的局限性

3.3 主动中国墙模型

3.3.1 主动冲突关系和主动联盟关系

3.3.2 主动中国墙模型ACWM

3.3.3 ACWM 模型安全特性

3.4 模型分析与比较

3.4.1 与传统中国墙模型比较

3.4.2 与BLP 模型比较

3.4.3 模型适应性分析

3.5 模型典型应用分析

3.5.1 基于ACWM 的访问控制框架

3.5.2 终端系统中电子文档泄漏防护

3.5.3 虚拟机环境下数据泄漏防护

3.6 本章小结

第四章面向可信主体约束的动态隔离机制

4.1 引言

4.1.1 可信主体的概念

4.1.2 数据泄漏防护中的可信主体

4.2 传统虚拟隔离机制

4.2.1 传统虚拟隔离技术

4.2.2 传统虚拟隔离机制的局限性

4.3 面向可信主体约束的动态隔离机制

4.3.1 研究动机

4.3.2 动态隔离机制

4.3.3 动态隔离实施策略

4.4 动态隔离机制安全性分析与比较

4.4.1 动态隔离机制安全性分析

4.4.2 与传统隔离机制的比较

4.5 动态隔离典型应用实现

4.5.1 扩展引用监控框架

4.5.2 DI-FVM 实现结构

4.6 本章小结

第五章基于使用预期的主动安全存储结构

5.1 引言

5.2 基于预期的使用控制模型

5.2.1 传统使用控制模型及其局限性

5.2.2 预期使用控制的相关概念

5.2.3 基于预期的使用控制模型

5.3 模型描述与分析

5.3.1 模型描述

5.3.2 模型安全性分析与比较

5.4 基于使用预期的主动存储体系结构

5.4.1 传统主动存储及其局限性

5.4.2 主动安全存储体系结构

5.4.3 主动安全防护实施流程

5.5 本章小结

第六章主动安全移动存储器原型及测评

6.1 引言

6.2 主动安全存储器结构

6.3 主动安全存储器实现

6.3.1 U+KEY 硬件实现

6.3.2 DI-FVM 实现

6.4 性能测试与分析

6.4.1 性能测试

6.4.2 安全性分析与比较

6.5 本章小结

第七章结束语

7.1 工作总结

7.2 研究展望

致谢

参考文献

作者在学期间取得的学术成果

（7）远程实时图形渲染系统的研究与实现（论文提纲范文）

摘要

ABSTRACT

第一章引言

1.1 研究背景

1.2 研究现状

1.3 课题的来源与本文的主要内容

1.4 论文的结构安排

第二章相关技术

2.1 Romans 图形渲染引擎

2.1.1 Romans 图形渲染引擎概述

2.1.2 Romans 图形渲染引擎主要模块

2.1.3 Romans Engine 用例图

2.2 集群技术

2.2.1 集群概述

2.2.2 集群的分类

2.3 负载均衡技术

2.3.1 LVS 集群的负载均衡技术

2.3.2 LVS 的负载均衡算法分类

2.4 动态迁移技术

2.4.1 动态迁移在集群系统中的应用

2.4.2 适用范围

2.5 本章小结

第三章远程实时图形渲染系统的总体设计

3.1 系统的设计目标

3.2 系统的结构设计

3.3 系统模块设计

3.4 系统用例分析

3.5 渲染任务的处理步骤

3.6 本章小结

第四章负载均衡与动态迁移算法设计

4.1 负载均衡算法设计

4.1.1 负载均衡算法的设计要求

4.1.2 LVS 的常用负载均衡调度策略

4.1.3 负载均衡算法流程

4.2 动态迁移算法设计

4.2.1 动态迁移的设计要求

4.2.2 动态迁移算法流程

4.3 本章小结

第五章远程实时图形渲染系统的实现

5.1 渲染服务器的实现

5.1.1 多用户同时渲染的实现

5.1.2 线程池的设计和实现

5.2 负载均衡模块的实现

5.2.1 传递负载信息的两种典型实现方式

5.2.2 负载的计算

5.2.3 服务节点权重的计算

5.3 动态迁移模块的实现

5.3.1 动态迁移的实现方式

5.3.2 动态迁移的实现细节

5.4 本章小结

第六章系统测试

6.1 测试环境

6.2 系统运行效果

6.2.1 系统运行步骤

6.2.2 客户端运行效果

6.2.3 测试结果

6.3 本章小结

第七章总结与展望

7.1 本文工作总结

7.2 对进一步工作的展望

致谢

参考文献

攻读硕士学位期间的科研成果

（8）面向分布式关键任务系统的自愈调控技术研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 研究背景

1.2 相关研究现状

1.2.1 自愈调控研究起源与发展

1.2.2 自愈调控策略生成与优化

1.2.3 自愈调控数据分析与预测

1.2.4 关键任务自愈调度机制

1.3 存在问题和发展趋势

1.3.1 当前存在问题

1.3.2 发展趋势

1.4 论文目的与意义

1.4.1 研究目的

1.4.2 研究意义

1.5 论文研究内容

1.6 论文组织结构

第2章自愈调控总体架构设计与形式化建模

2.1 引言

2.2 自愈调控总体设计原则

2.2.1 自愈调控基本模式

2.2.2 自愈调控设计流程

2.2.3 自愈调控评价体系

2.3 自愈调控总体架构设计

2.3.1 自愈调控数据分析

2.3.2 自愈调控策略生成

2.3.3 关键任务自愈调度

2.4. 基于π演算的自愈调控形式化建模

2.4.1 状态π演算基本语法

2.4.2 关键任务执行流程

2.4.3 关键任务状态π演算语义

2.4.4 任务执行形式化验证

2.5 本章小结

第3章基于POMDP的自愈调控策略生成与收敛性分析

3.1 引言

3.2 自愈调控策略逻辑规约

3.2.1 自愈调控策略基本表述

3.2.2 自愈调控策略执行模式

3.3 自愈调控策略管理

3.3.1 自愈调控策略分类

3.3.2 自愈调控策略化简

3.4 自愈调控策略更新

3.4.1 随机决策过程基本定义

3.4.2 自愈调控策略更新算法

3.4.3 策略收敛性分析

3.5 实验结果与分析

3.5.1 LANL失效策略统计

3.5.2 随机策略收敛性测试

3.6 本章小结

第4章基于局部线性嵌入算法的自愈调控数据分析与预测

4.1 引言

4.2 失效预测问题定义

4.2.1 失效预测基本框架

4.2.2 失效特征相关性分析

4.3 离散型失效事件联合聚类

4.4 数值型失效数据降维与预测

4.4.1 失效预测流程设计

4.4.2 失效数据高维欧氏空间构建

4.4.3 有监督的局部线性嵌入

4.4.4 局部嵌入映射的优化

4.5 实验结果与分析

4.5.1 失效数据聚类分析

4.5.2 失效预测性能测试

4.6 本章小结

第5章基于DAG任务重构迁移的关键任务调度机制

5.1 引言

5.2 任务迁移问题定义

5.2.1 任务迁移框架

5.2.2 DAG任务描述

5.2.3 迁移任务死锁避免

5.3 关键任务动态迁移

5.3.1 任务执行时间计算

5.3.2 DAG动态重构

5.3.3 可迁移性判定

5.4 基于任务-资源分配图的多任务迁移

5.4.1 关键任务资源分配流程

5.4.2 任务迁移代价分析

5.5 实验结果与分析

5.5.1 任务调度方案设计

5.5.2 DAG任务重构

5.5.3 任务迁移性能测试

5.6 本章小结

结论

参考文献

攻读博士学位期间发表的论文和取得的科研成果

致谢

（9）多处理器系统中的线程调度研究（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 课题研究背景

1.2 论文的主要工作

1.3 论文的组织结构

第二章 SMP 系统及线程调度

2.1 SMP 系统

2.1.1 基于总线的SMP

2.1.2 基于交叉开关的SMP

2.1.3 基于多级交换网络的SMP

2.2 进程与线程

2.2.1 进程概念及原理

2.2.2 线程概念及原理

2.3 进程调度及调度算法

2.3.1 调度算法分类

2.3.2 常用调度算法

2.4 本章小结

第三章 LINUX 调度系统及CFS 剖析

3.1 LINUX 内核调度器简史

3.2 O(1)调度器概要

3.3 完全公平调度器概要

3.3.1 模块化的调度器接口

3.3.2 CFS 调度器

3.3.3 CFS 组调度

3.4 CFS 实现核心

3.5 红黑树介绍

3.6 CFS 关键数据结构

3.6.1 struct task_struct 的变化

3.6.2 struct sched_entity 结构体

3.6.3 struct sched_class 结构体

3.6.4 struct cfs_rq 结构体

3.6.5 struct task_group 结构体

3.7 CFS 核心代码剖析

3.7.1 scheduler_tick(…)函数

3.7.2 task_tick_fair(…)函数

3.7.3 entity_tick(…)函数

3.7.4 update_curr(…)及__update_curr(…)相关函数

3.7.5 check_preempt_tick(…)函数

3.7.6 schedule(…)函数

3.7.7 put_prev_task_fair(…)及相关函数

3.7.8 pick_next_task_fair(…)及相关函数

3.8 源代码分析总结

3.9 CFS 组调度支持

3.10 CFS 与SMP

3.10.1 调度域

3.10.2 Linux SMP 系统调度层级结构

3.10.3 CFS 之SMP 负载平衡

3.11 本章小结

第四章高性能SMP 调度系统研究

4.1 SMP 调度基础

4.1.1 同步机制

4.1.2 局部性原理

4.1.3 SMP 负载均衡策略

4.1.4 调度策略

4.2 高效SMP 调度系统分析

4.2.1 较小粒度的锁

4.2.2 独立的运行队列

4.2.3 分级的负载平衡机制

4.2.4 高效SMP 调度系统图例

4.3 LINUX SMP 调度优化

4.3.1 优化原理分析

4.3.2 Futex 概要原理

4.3.3 内核改动分析及实现

4.3.4 简单验证及分析

4.4 本章小结

第五章总结与展望

致谢

参考文献

攻硕期间取得的研究成果

（10）HLA仿真成员动态规划方法及其工具研究（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 引言

1.2 课题研究的背景

1.3 国内外研究现状

1.4 论文的主要工作

1.5 组织结构

第二章 HLA仿真成员规划方法研究

2.1 成员规划的需求

2.2 基于BOM的组件式成员结构分析

2.2.1 BOM概述

2.2.2 可扩展联邦成员框架

2.2.3 联邦成员结构的转变

2.3 基于BOM组件的静态成员规划方法

2.3.1 成员规划结构设计

2.3.2 成员规划基本原则

2.3.3 成员规划方法设计

2.4 基于BOM组件的动态成员规划方法

2.4.1 成员动态规划的意义

2.4.2 成员动态规划的原理

2.5 本章小结

第三章仿真动态规划算法研究

3.1 仿真运行前的规划算法

3.1.1 静态成员规划算法

3.1.2 静态任务规划算法

3.2 仿真运行中的规划算法

3.2.1 仿真动态规划算法的设计原则

3.2.2 成员动态规划的衡量标准和调整策略

3.3 算法验证实例

3.4 本章小结

第四章成员迁移关键技术研究

4.1 联邦成员迁移方法与迁移协议研究

4.1.1 联邦成员迁移方法研究

4.1.2 联邦和成员的状态保存和恢复

4.1.3 移动Agent联邦成员的设计

4.2 组件迁移方法与迁移协议研究

4.2.1 仿真模型组件结构描述

4.2.2 仿真模型组件的运行监控描述

4.2.3 组件迁移的设计

4.2.4 组件迁移在并行仿真系统中的应用研究

4.3 基于所有权管理服务的实体迁移方法与迁移协议研究

4.3.1 HLA中所有权管理服务

4.3.2 实体迁移解决方案的设计

4.4 本章小结

第五章成员动态规划支撑工具原型设计与实现

5.1 成员动态规划的功能要求

5.2 成员动态规划支撑工具的设计要求

5.3 成员动态规划支撑工具的模块化设计

5.3.1 方案生成模块的设计

5.3.2 运行控制模块的设计

5.3.3 联邦分析模块的设计

5.3.4 成员迁移模块的设计

5.4 成员动态规划支撑工具的实现

5.4.1 开发环境

5.4.2 程序实现

5.5 成员动态规划支撑工具的应用

5.6 小结

第六章总结与展望

6.1 论文总结

6.2 课题展望

致谢

参考文献

作者在学期间取得学术成果

（一）发表的学术论文

（二）参加的科研工作

四、群机系统中进程迁移实现机制的研究（论文参考文献）

[1]面向超级计算机的故障预测和容错关键技术研究[D]. 胡维. 国防科学技术大学, 2017(01)
[2]智能集群渲染管理软件分析与设计[D]. 马海银. 山东大学, 2013(04)
[3]KVM虚拟机CPU虚拟化的研究与调度策略的优化[D]. 黄煜. 成都理工大学, 2012(03)
[4]图像检索的并行计算方法与系统[D]. 钟新玉. 北京理工大学, 2011(07)
[5]多机环境下进程迁移技术的实现与应用[D]. 申思. 云南大学, 2011(04)
[6]面向内部威胁的数据泄漏防护关键技术研究[D]. 马俊. 国防科学技术大学, 2011(03)
[7]远程实时图形渲染系统的研究与实现[D]. 陈帆. 电子科技大学, 2011(12)
[8]面向分布式关键任务系统的自愈调控技术研究[D]. 卢旭. 哈尔滨工程大学, 2011(05)
[9]多处理器系统中的线程调度研究[D]. 范光雄. 电子科技大学, 2010(04)
[10]HLA仿真成员动态规划方法及其工具研究[D]. 赵鑫业. 国防科学技术大学, 2009(S2)

标签：进程调度论文; 集群技术论文; 容错机制论文; 数据迁移论文; 集群服务器论文;

集群计算机系统进程迁移实现机制研究

一、群机系统中进程迁移实现机制的研究（论文文献综述）

二、群机系统中进程迁移实现机制的研究（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、群机系统中进程迁移实现机制的研究（论文提纲范文）

（1）面向超级计算机的故障预测和容错关键技术研究（论文提纲范文）

（2）智能集群渲染管理软件分析与设计（论文提纲范文）

（3）KVM虚拟机CPU虚拟化的研究与调度策略的优化（论文提纲范文）

（4）图像检索的并行计算方法与系统（论文提纲范文）

（5）多机环境下进程迁移技术的实现与应用（论文提纲范文）

（6）面向内部威胁的数据泄漏防护关键技术研究（论文提纲范文）

（7）远程实时图形渲染系统的研究与实现（论文提纲范文）

（8）面向分布式关键任务系统的自愈调控技术研究（论文提纲范文）

（9）多处理器系统中的线程调度研究（论文提纲范文）

（10）HLA仿真成员动态规划方法及其工具研究（论文提纲范文）

四、群机系统中进程迁移实现机制的研究（论文参考文献）

猜你喜欢