天天看点

Anatomy of the Grid翻译(1)

下面是我之前的翻译,由于英语很差,所以翻译质量很不尽人意。

                                          解析网格

                                      可以升级的虚拟组织

                                              摘要

    网格计算作为一个新的重要领域正在显现,不同于传统的分布式计算,它的焦点在高度可扩展的资源共享,革新应用以及某些情况下的高性能定位。在这篇文章中,我们将定义这个新的领域。首先我们先回顾一下“网格问题”,我们定义为灵活的,安全的,协调的资源共享,在动态的个人,组织,资源集合的资源共享――我们称之为虚拟组织。在这些条件下,我们会遇到像,统一认证、授权、资源存取、资源挖掘和一些其他问题的挑战。这些都是网格技术所要处理的问题。接下来,我们介绍一个可扩展的,开放的网格构架,它的各种协议,服务,应用程序接口,软件开发工具按照它们在资源共享中的不同作用进行分类。我们描述了各种我们认为任何类似的机制所必须满足的需求,并且我们讨论了定义一个紧凑的,能够使不同的网格系统之间进行互用的网格内部协议集的重要性。最后,我们讨论如何结合网格技术与其他的当前技术的关系,包括:公司整合、应用服务提供商、存储服务提供商和P2P计算。我们认为网格概念和技术补充了那些相关领域,并且做出很大的贡献。

1.介绍

    “网格”这个术语是90年代中期创造的,是用来表示为高级科学与工程[34]提出的分布式计算基础结构而产生的。相当大的进展是在构建这样的一个基础结构中发生的(e.g., [10, 16, 46, 59]),但是至少在普遍的认知中,用来包含从高级网络到人工智能中的任何事物,“网格”这个术语也被混合进去了。或许有人怀疑这个术语是否有真正的含义和意义。是否真的存在明显的“网格问题”而因此需要新的“网格技术”?如果需要,这些技术的本质是什么?它们的适用范围又是什么?虽然众多的组织对网格的概念和共享思想感兴趣,但在某种重要程度上,对网格体系的普遍看法,我们并没有看到对这些问题的一致回答。

    在这篇文章中,我们的目的是说明,网格概念确实是由真正的已经出现的特定的问题,定义明确网格技术奠定了解决这些问题的重要方面。在这个过程中,我们为当前和将来网格技术的发展制定了一个详细的体系结构和路标。而且我们确定网格技术不同于其他当前技术的发展趋势,例如因特网、企业、分布式和点对点,而这些技术的发展趋势将从网格技术所立足的问题中获得巨大的益处。

    在网格概念下的实际、特定的问题是协调共享资源和在动态的,多机构的虚拟组织中解决问题。我们关心的共享不是以文件共享为主的共享,而是在工业、科学、工程领域产生有合作问题解决和资源代理需要时,直接对计算机、软件、数据、以及其他资源进行存取。这些共享有必要进行高度的控制,包括对资源提供者和消费者有清晰的定义和详细的确认什么可以共享的,谁被允许共享和共享发生的制约条件。由这些规则所定义的个人和协会的集合就形成了我们所谓的虚拟组织(VO)。 

    下面是一些关于虚拟组织的例子:应用服务提供商、存储服务提供商、循环提供商和为一家汽车制造商在新工厂的方案进行评估的顾问们;投标一个新航天器的某些工业协会的成员;用于对紧急情况进行响应的危机处理小组和数据库以及模拟系统;一个国际大型常设高能物理研究机构。这里的每个例子都代表一个在拥有大量计算和数据的环境下,基于合作进行解决问题和计算的方法。

    如同这些例子所表示,虚拟组织在他们的目的,范围,大小,持续时间,结构,社区和社会学方面都有很大的不同。不过,对潜在的技术需求的细心研究让我们发现这些关心问题和各种需求在大的方面又是类似的。特别的,我们看到高度可扩展的共享关系,从服务器—客户端到点对点;需要复杂的,准确的对共享资源如何使用的控制级别,包括有微粒的和多个资源共享式的访问控制,代理和本地应用及全居策略;为共享各式各样的资源,从程序,文件,数据到计算机,传感器,网络;需要不同的使用方式,从单用户到多用户,从性能敏感到费用敏感,由此产生的问题包括服务质量,时间安排,分配原则和账目清算。

    而当前的分布式计算技术没有把上面所列出问题作为关注点。例如,分布式网络技术所关注的计算机间通信和信息交换并没有提供在多个计算的站点间对等使用资源的综合方法。B2B交换关注信息的共享(通常通过集中服务器)。虚拟企业同样如此,尽管这里的共享可能最终扩展到了应用和物理设备。企业分布式计算技术像CORBA 和J2EE实现了单个企业内的资源共享。分布式计算环境开放研究小组(DCE)支持站点间的安全共享,但是许多的虚拟组织发现这样的负担太重且扩展性不强。存储服务提供商(SSPs)和应用服务提供商(ASPs)允许其人也从外面活的存储资源和计算资源,但是这些受到约束:例如,SSP的资源是典型的通过虚拟专用网络(VPN)连接客户。总之,当前的这些技术要么不适用于这么多的资源种类,要么对VO的共享资源没有提供可扩展的必要的控制。

    现在网格技术开始进入视野。在过去五年,进过网格社区的努力研究和开发已经出现了一些协议、服务和工具,为使他们能够在我们建设可升级的VO时接受考验。这些技术包括支持跨组织的心永和策略管理的解决方案;支持远程的对计算和数据资源进行安全访问以及在多资源状况下进行并发分配的资源管理协议;对资源、组织和服务的提供配置和状态信息的信息查询的协议和服务;在存储系统和应用系统之间定位和传输数据的数据管理服务。

因为它们关注于动态的,跨组织的共享,所以网格技术是对现有的分布式计算的补充,而不是和它竞争。例如,企业分布式计算系统可以使用网格技术去实现机构边界的资源共享;对于ASP和SSP,网格技术可以用来建立计算和存储资源的动态分配,从而克服当前静态配置的限制。下面我们将会对网格技术和这些技术之间的关系进行更详细的讨论。 

在下面的各章节,我们将依次展开介绍以上的各点。我们的目标是:(1)为那些不熟悉这个领域的人介绍虚拟组织和网格计算的本质;(2)为发展中的网格计算建立一个标准的词汇表和定义一个全面的体系结构框架;(3)清晰定义如何使网格技术和其他技术关联起来的并且解释两个问题:为什么已经出现的技术没有解决网格计算的问题和这些技术怎么从网格计算中获得益处。

    我们相信VO有潜力去极大的改变我们使用计算机解决问题地方式,就像web改变我们如何交换信息一样。正如文中的例子所示,对于协作过程是需要很多不同的规则和活动作为基础的:它并没有局限于科学,工程,商业活动。正因为如此,有光明未来的VO概念—网格技术也是很重要的。

 2. 虚拟组织的出现 

考虑下面的四个场景:

    1. 一个公司需要做出一个决策,为布置一个新的工厂而从ASP那里调用一个成熟的金融 预报模型,一个SSP提供给他访问存储系统上数据库中适当的私有历史数据的权力。在决策制定期间,场景是共同合作和交互进行的,即使参加做出决定的部门在不同的城市。ASP已经和循环提供商签订了在有特别需求的场景中额外的“精神”,并要求循环提供商满足所期望的安全性和性能要求。

    2. 一个工业协会被要求承担下一代高精度多学科的超音速飞行器的可行性的整体模拟。这个模拟集合了不同参与者设计的专用软件,每个软件都能在每一个参与者的机器上运行,能够按计划访问适当的数据库并且其余的数据可由该协会的其他会员使用。

    3.一个危机处理小组利用当地的天气和土壤模型对一次化学泄露的传播的响应,在人口位置和地理特征(例如河流和供水系统)的基础上对时间的程度进行判断,建立一个短期的恢复计划(或许在化学反应模型上),应急响应人员按计划安排协调疏散,通知医院等事物。

    4.世界上数以百计的实验室和大学的数千名物理学家联合设计、制造、管理和分析一个大型探测器在CERN(欧洲高能量物理实验室)。在分析期间,他们集中他们的计算、存储和网络资源去创造一个“数据网格”使其有能力分析PB级的数据。

这四个例子在许多方面是不同的:参与者的类型和数量、关注的种类、协作的持续时间和规模以及被共享的资源。但是它们也有不少相似的地方,像下面要讨论的部分(也可以看图1)。

在每一个例子里,许多不信任的但有不同程度关系的的设计者(或许根本没关系)打算互相共享资源以便完成任务。而且,共享比简单的交换更难(像在虚拟组织中):它牵扯直接对远程软件、计算机、数据、传感器和其他资源。例如,一个联盟的成员或许有权对专门的软件和数据以及他们的计算资源。

    图1:一个实际的组织可以加入一个或多个虚拟组织以便共享它的部分或全部资料。我们显现三个实际的组织(椭圆形)和两个虚拟组织(P),连接同伴在一个航空设计集团,Q连接着同意共享剩余计算能力的大学,例如光线跟踪计划。图中左边的组织参与者在P中,右边的组织参与者在Q中,第三部分既是P又是Q的。用于管理访问资源的策略因参与的实际的组织,资源和虚拟组织的不同而不同。

    资源的共享是有条件的:每个资源的拥有者以时间,地点和能做的工作的约束来共享资源。例如,一个在图1中虚拟组织P的参与者可能仅仅允许虚拟组织的伙伴为“简单”的问题而调用他们的模拟服务。资源的消费者也可能放置一些约束在他们准备使用的资源的所有权上。比如,一个在虚拟组织Q的参与者可能仅仅接收经过认证为“安全”的共享的计算机的资源。这种约束的实施需要一些传递策略的机制来建立消费者和资源的身份(认证),以及决定一个操作是否和可用的共享关系是一直的(授权)。 

    共享关系能够随时间动态变化,也取决于涉及的资源,访问权限的类型和被允许进行访问的参与者进行动态的改变。而且这些关系没有必要牵涉到一个指定的个人集合,但是可能要以管理对资源访问的策略模糊的界定。例如,一个组织可能允许任何能够证明他们是“消费者”或者“学生”。 

    这种动态的共享关系意味着我们需要一种查找和描述这种实时存在的方法,例如,一个新的加入虚拟组织的成员Q必须确定它能共享什么样的资源,这些资源的“质量”和管理访问的策略。

    共享关系通常不是简单的客户-服务器结构,而是点对点的:提供者也可以使消费者,而且共享关系存在于任何参与者的子集中。共享关系可能会结合起来用以对等地使用由不同的组织所有的资源。例如,在虚拟组织Q中,一个计算在一个共享的计算资源上启动,或者在其他地方初始化一个子运算。这些情形下在控制方式上的权威代表能力变得重要起来,就像跨资源的对等操作的机制一样。

    同样的资源可能以不同的方式被使用,这取决于共享的限制以及共享的目的。例如,一个计算机可能在一个共享的安排中仅仅被用于运行特定的软件的部分程序,而在其它的时候可以提供一般的计算周期。由于缺乏一个资源将被怎么样使用的预备知识,所以性能韵律学,期望,和限制(e.g.,服务的质量)可能作为一部分放在资源共享和使用的条件上来。 

这些特征和需求定义了术语虚拟组织,一个我们相信是正在成为很多现代计算的基础的概念。虚拟组织使得完全不同的成组的组织和个人能够以一个受到控制的方式共享资源,因此成员们可以为达到一个共同的目的而展开合作。