0
点赞
收藏
分享

微信扫一扫

虹科案例 | 超级计算中心如何使用高性能计算推进科学研究?

计算、理论、实验被称为现代科学研究的“三驾马车”,无论是高校、研究所还是企业,高性能计算对于材料、化学、计算机、工程、生命科学、大气等领域以及计算机辅助工程​

北德超级计算联盟简介

北德超级计算联盟HLRN于2001年,是德国北部七个州的联合项目。HLRN超级计算机已被100多所大学和120多家研究机构所使用,以此探索科学研究的许多前沿领域,帮助开启更美好的未来。HLRN III超级计算机系统2014年1月被研发出来,是世界上最强的超级计算机之,拥有约25000台高端PC的计算能力,由柏林Zuse研究所和汉诺威莱布尼茨对其进行托管

虹科案例 | 超级计算中心如何使用高性能计算推进科学研究?_高性能计算


HLRN面临的挑战

1.需要并行计算来管理和优化站点为了德国北部各州提供强大高效的PB级计算资源,HLRN需要将HLRN III作为个组合系统联合运行然而,对两个远程位置进负载平衡挑战,例如时间延迟和独立集群之间不断变化的通信因此HLRN需要启计算来管理和优化柏林和汉诺威站点之间的多个集群

2.难以处理庞大的计算作业:作为由德国州和联邦政府资助的非营利组织,HLRN的超级计算系统除了免费为德国北部的科学家和研究人员提供重要服务外,HLRN还为组织的项目提供技术支持以解决关键用户问题,例如优化、批量处理作业、资源分配等,这导致HLRN III的需求量很大。为了处理如此庞的计算作业队列,柏林和汉诺威站点必须保持24h全天候运资源正常运时间和作业吞吐量带来了非常大的挑战

3.作负载要求多HLRN每分每秒都运150多个项,平均作业大小为10GB这些项目对工作负载具有不同的要求,因此需要研究员创建自定义应用程序

4.项目准备时间长:个项成功完成后,必须创建新的数据集为下个传⼊项做准备HLRN的顾问帮助系统可能需要天甚至几周的时间准备算法以运密集计算。


HLRN选择虹科Adaptive高性能计算套件Moab

HLRN于2008年开始使Moab来管理其计算工作负载目前在其分布式Cray XC30超级计算系统HLRN III上运Moab HPC Suite企业版HLRN站点利用Moab来支持其在广泛领域的先进科学研究,包括生物信息学、化学、候和海洋建模、工程、环境研究、流体动学和物理学等领域。其次,还利用Adaptive Big Workflow即更高效的处理密集模拟和大数据分析加速数据洞察和解决HLRN的数据挑战使得研究人员能够在复杂的异构HPC集群环境中提供有价值的Moab HPC Suite是Adaptive Big Workflow解决方案中不可或缺的部分

Moab HPC Suite(Moab高性能计算套件)是虹科Adaptive Computing的一个工作负载和资源编排平台,可自动调度、管理、监控和报告大规模的HPC 工作负载。获得专利的Moab智能引擎使用多维策略和先进的未来建模以优化各种资源上的工作负载启动和运行时间。这些策略平衡了高利用率和吞吐量目标与相互竞争的工作负载优先级和SLA要求,从而通过优先级顺序在更短的时间内完成更多的工作。Moab HPC Suite 优化HPC系统的价值和可用性,同时降低了管理成本和复杂性。

虹科案例 | 超级计算中心如何使用高性能计算推进科学研究?_并行计算_02


高性能计算解决

1.选择Moab HPC Suite为了充分满其研究标并实现并计算,HLRN选择了Moab HPC Suite作为其新的分布式超级计算系统。HPC套件由Adaptive Computing的智能作负载管理软件Moab提供⽀持,该软件可根据策略优化跨作负载调度管理资源。

2.通过BigWorkflow进模拟和数据分析为了将两个集群的计算资源结合起来,HLRN通过Big Workflow进模拟和数据分析Big Workflow还能够协调和优化分析流程,以提吞吐量和,降低成本、复杂性和错误。即使数据挑战,HLRN仍然可以保证最限度地延正常运时间保证服务交付且资源得到公平分配。

3.使用Moab模块在Moab HPC Suite企业版中,HLRN使了许多Moab模块

管理-统一工作负载决策

Moab模块作负载管理解决案使HLRN能够连接柏林和汉诺威不同集群并共享计算资源这允许HLRN跨策略和资源同步管理、合并报告优化跨集群的作负载共享和数据管理此外,格环境使HLRN能够同时在两个站点上运计算作业,动化所有复杂的作负载决策,从实现更的负载平衡。

策略引擎-加速

随着条件和作负载的变化,Moab能主动满足HLRN的优先事项优化HLRN集群利例如:如果一组研究员在某个时间没有作要运Moab允许运其他具有低优先级的作业进行回填调度)此外,策略引擎也将动确保正确的工作负载在最佳时间的运行(例如,回填作业获得低优先级或在预期运新的优先级作业时暂停)。

计费管理-预算保证

HLRN将MAM(Moab Accounting Manager)与其会计软件集成,从而根据资源共享协议安排资源。此功能用于管理不同研究组的账户确保每个研究组都能基于预算、时间和MAM中可的其他参数公平共享使用集群的。此外,MAM可以使HLRN的预算分配与利率保持,确保不超过使限制预算。


价值成果

HLRN在使用Moab HPC Suite后获得了如下成果:

1.实现并行计算通过协调的动态配置和多集群格环境Moab HPC Suite使HLRN能够利其分布式超级计算系统实现并行计算。

2.统一任务管理:通过Big Workflow将两个集群作为一个生态系统运HLRN能够统管理从工作流调度到账户管理的所有任务。

3.满足工作负载需求:通过Moab调度能力HLRN不仅可以更好地处理激增的作负载需求,在多个异构系统之间实现更的管理效率还能够满足大需求并提高作业吞吐量。

4.化多集群ROIMoab使HLRN实现达80%的资源限度地提用户并满足大量工作负载需求并基本消除作延误和故障

Moab的这些优势加快了HLRN研究的分析速度帮助科学研究快速”打开新世界的大门“!​

想要了解【虹科Adaptive computing Moab高性能计算套件】及【行业解决方案】,欢迎关注虹科云科技官网或者评论交流!



举报

相关推荐

0 条评论