IBM蓝色基因超级计算机。
蓝色基因
美国能源部于2000年开始与IBM合作,计划投入经费来研发一台超级计算机,以此探索高性能计算机的设计方向。双方设计开发的结晶就是我们所看到的蓝色基因。蓝色基因能够处理大量数据,并针对带宽、可扩展性和计算能力进行了专门的优化,与此同时,它所消耗的能源和占用的空间只相当于今天速度最快系统的一小部分。
2003年,蓝色基因的原型机经过三年研发,终于浮出水面,当年11月它就一举登上TOP500第73名。随后,蓝色基因以半年一个台阶快速占领TOP500排行榜。2004年6月,第4名;2004年11月,第一名,70万亿次浮点运算速度,超越占据第一位置几年之久的
地球模拟器。2005年 3月,135万亿次,2005年11月280.6万亿次。
截至2005年11月发布的TOP 500,蓝色基因有19台上榜,前20名就有5台,并稳守冠军亚军。全世界速度最快的那台超级计算机蓝色基因安装在美国能源部
国家核安全局的劳伦斯·利弗摩尔国家实验室,它在64组机架中安装了131,072颗
PowerPC处理器。
蓝色基因是IBM所提供的一套革命性的全新解决方案,在安装时可以选择只装1组机架到64组机架全部装上,能为用户提供一套具有高度可扩展性的解决方案。蓝色基因并不只是一部扩展性极强的超级计算机,效率也非常高。蓝色基因特别设计的体系架构可以高密度部署处理器、内存和互联系统,更低的功耗和更小的占地面积也使其居于业界领先地位。
应用
蓝色基因计划在2000年第一次获得授权时,其目标就是发展能应用于生物分子现象(例如
蛋白质折叠)研究的大型并行计算机。这些努力的成果将能通过大量的模拟,对蛋白质折叠的机制有更进一步的了解,此外还能探索在大型并行计算机架构和软件方面的创新想法。蓝色基因所能提供的性能等级能够大幅度提高模拟的规模,并远远超越其它超级计算机。在此规模上,成功的蛋白质折叠模拟研究可望在生物分子仿真的技术、模型和算法上能有更进一步的发展。
诸多不同应用层面的实践经验显示,蓝色基因架构适用于各学科间相互关联的作业。如今,IBM与许多机构正共同努力,扩展蓝色基因架构上高性能计算应用的名单,这些应用包括了生命科学、金融模型、流体力学、量子化学、
分子动力学、天文学和宇宙研究、材料科学和气候模型。
实践
蓝色基因能帮助
美国国家大气研究中心的研究人员建立大气模型,并且能确保该中心在业内处于领先地位。使用蓝色基因系统等超级计算机,美国国家大气研究中心将能更快地建立模型和分析资料,还能估算引起大气变化的天然因素和人类活动正如何影响气候。
荷兰ASTRON是领先的天文学组织。这个组织使用蓝色基因作为新型
射电望远镜的中央处理引擎。这款新型的射电望远镜叫做LOFAR,它能够研究宇宙形成后,最早期的恒星和银河在萌芽阶段的状况。
波士顿大学打算利用蓝色基因来设立处理艰深科学问题的主机,这些科学问题包括核物理学、基因学、细胞生物学到宇宙气候和海洋系统的模型建立。例如,波士顿大学的研究人员打算利用蓝色基因来预测太阳表面上的活动(例如太阳耀斑)是如何影响地球的辐射带、地球的上层大气层和电离层。当许多科学家和研究人员将大规模集群运算应用到不同的问题组,并在类似计划发展中建立共同的专业知识时,蓝色基因的相关性就变得更加清楚。
架构设计
蓝色基因系统是由大量运算节点组成,每个节点的时钟频率相对来说都不很快,以节省电力和降低成本。蓝色基因采用IBM PowerPC嵌入式处理器、嵌入式DRAM和系统芯片技术,并整合所有系统功能,其中包括计算处理器、通讯处理器、三层高速缓存,在单一ASIC上有着复杂路径的多重高速互联网络。因为处理器时钟周期相比之下速度较为缓慢,因此就时钟周期而言,内存近似于处理器。这对减少耗电量来说是一项优点,还能将1024个计算节点(内含2颗 PowerPC嵌入式处理器)放在单一机架内进行密集封装。蓝色基因可以扩充到65,536个计算节点(共计131,072颗处理器),其峰值速度可达到 367万亿次浮点运算速度,除了成本效益,还有低耗电、冷却效果好及节省占地面积等特色。
蓝色基因是由下列组件构成:每计算节点2个处理器,每计算卡上有2个计算节点、每节点板上有16 张计算卡、每机架有32个节点板、机架由上下两部分组成,中间有2个中间平面。
每个处理器在每个周期中可以执行4次浮点运算。依照在蓝色基因上所执行应用程序性质的不同,程序设计人员可以选择在单一运算节点上同时采用两个处理器进行运算,或是以一个处理器专门处理通信。除了这些运算节点外,蓝色基因系统还提供了可弹性决定使用数量的双处理器I/O(输入/输出)节点,这些节点可以处理运算节点和其它系统间的通讯。
蓝色基因的计算节点是通过5种网络来互相连接,这5种网络分别是:1个3D圆环面网络,用在计算节点间以点对点的方式传输信息;1个总体集合网络,用于整个应用中的总体运行;1个总体障碍和中断网络;1个千兆以太网,用来控制机器;还有另1个千兆以太网,用来连接到其它系统。3D 圆环面网络让每个节点都能和最近的6个相邻节点以低延迟时间、高带宽互连,3D圆环面网络还支持一般的点对点通讯。圆环面网络在使用区域通讯的应用程序上特别有效。总体集合网络对提高平常使用的MPI总体通讯架构的速度相当有用。而总体障碍网络能够迅速地同步化系统内所有处理器的状态。
蓝色基因还需要一个服务节点,在这个节点上系统管理员可以管理储存资料用的文件服务器。蓝色基因还能管理复杂的前端节点,在这些前端节点上终端用户可以编译资料并发出工作指令。蓝色基因包含了多种设计创新,可以扩展到之前无法到达的性能水平,而且还能将客户系统的耗电量、散热量和可用的占用空间限制在合理范围内。
常用环境
在软件环境方面,蓝色基因也有特别设计,强调遵守下列三项基本原则:简单化、高效和广泛性。在软件设计时以简单化的原则进行开发,且能够利用硬件功能的优势,既保证高效又兼顾稳定和安全性。而依据熟悉且被广泛使用的程序语言、资料库、工作管理工具和并行文件系统所建立的编程和管理环境,客户将能够从蓝色基因的创新设计要素中获益,而不用面对陡峭的学习曲线。
蓝色基因的前端节点是程序设计人员存取系统运算核心的入口。前端节点执行标准的SUSE SLES9版本Linux,能提供使用者熟悉的操作平台,让使用者可以在该操作平台上编辑程序、进行程序纠错等。支持蓝色基因系统的语言为用在Power PC上标准的IBM XL Fortran、C和C++编辑器,这些还增加了一个能利用双
浮点运算单元优势的末端,而这个双浮点运算单元是蓝色基因所独有的。
程序设计人员可以运用广受欢迎的IBM工程及科学子程序资料(Engineering and Scientific Subroutine Library,ESSL),这是一套最先进的资料库,收集了超过400个数学子程序,能给Fortran、C或C++等语言所写成的浮点工程和科学应用程序提供最佳性能。这些程序中有许多都已经调整成适用于蓝色基因架构。
为了支持并行编写程序,蓝色基因还一并提供了一套MPI解决方案,这套解决方案可以利用美国Argonne国家实验室的MPICH2数据库,可生成一个利用运算节点通讯技术的执行方案。
在工作任务及平衡工作量方面,IBM LoadLeveler对蓝色基因也提供支持。LoadLeveler已经过许多大规模集群客户的考验,能提供建立、提出和处理工作的设备,其设计是以可用资源来搭配应用程序处理过程中的需求。
蓝色基因中还包括了IBM General Parallel File System (一般并行文件系统,GPFS),可以进一步强化蓝色基因的软件环境。GPFS是一个高性能的磁盘共享文件系统,它能从蓝色基因的所有节点中提供快速数据存取功能。应用程序可以立即存取使用标准文件系统界面的共享文件,使用者将因此能从数个节点中存取同样的文件。
蓝色基因系统还包括一个让系统管理员可以管理该系统的服务节点。管理员可使用的重要功能有系统设定、初始化、监督功能和运行。这些功能都已经整合到IBM Cluster Systems Management产品中,以提供额外的管理功能和在单一控制点上,在CSM支持的运行平台间进行管理。能在服务节点上执行的还有一个和DB2相关的数据库,这个数据库是静态和动态状态的信息储存点。
总之,蓝色基因系统软件集合了诸多为用户考虑的因素,这些因素都为了达到高性能和高可靠性而加以调整,并符合许多现有集群客户所熟悉的特性。在这种情况下,客户将能够快速让蓝色基因发挥强大计算能力,还能从蓝色基因的结构功能中获益。
深度计算
IBM深度计算解决方案不仅有蓝色基因,还包括了以POWER处理器为主的UNIX
对称多处理器系统(SMP)、Linux集群、高速互连、存储、工作站、虚拟化解决方案和广泛的软件工具。IDC报告显示,IBM自1999年就成为大规模高性能计算领域的佼佼者。创新的蓝色基因解决方案,以及近十年内将计算速度提升到千万亿次的产品发展蓝图,都展示了IBM对深度计算和对人类所面临重大挑战而寻求解决方案的研究人员所作的不变承诺。
蓝色基因计划在过去五年中发展迅速。实践经验证明它可以应用到各种不同的计算密集型工作中,而且现有的应用程序增加了研究者接触蓝色基因的机会。蓝色基因将能为IBM集群解决方案带来极高价值的套装软件,这些努力也确保使用者熟悉它的运行环境。
和政府实验室、高等学术机构、应用程序和工具提供商及各行业一起共同研究,是蓝色基因的潜在能力能不断有新发现的原因。
自推出以来,蓝色基因以高成本效益比、高资源有效利用率及高可扩展性等特点,对人类科技发展不断做出了重大贡献。