新闻中心
华体会体育娱乐

浪潮信息创新运维管理解决方案助力智算平台实现精确纳管

发表时间:2024-04-23 02:36:49 来源:华体会体育娱乐

  化建设突飞猛进,随之而来的运维和管理挑战也逐渐凸显,并愈发受到业界关注。为助力中南大学智算平台解决传统人力运维管理难题,浪潮信息以自研ISPIM平台为核心,为其量身定制了自动化运维解决方案,从而使运维效率大幅度提升。

  中南大学智算平台作为一个硬件先进、功能齐全、资源丰富,面向全校师生提供高性能计算服务的开放性公共服务基础设施,拥有高达上千台很多类型的计算服务器,在满足科研人员大量计算资源需求的同时,大量集中部署的计算服务器集群对管理和运维人员提出了新的挑战。基于传统运维模式既没办法实现对计算集群快速而精准的有效运维,也造成了运维人力资源的沉重负担。对此,浪潮信息提出了以自研ISPIM(Inspur Physical Infrastructure Manager)浪潮信息物理基础设施管理平台为核心的自动化运维解决方案。

  在方案设计过程中,浪潮信息研发工程师通过当地考验查证、调研并与中南大学HPC平台管理和技术人员进行多次反复的交流、沟通和分析、研究,最终决定以“1+1+N高可用模式”,在5台服务器上部署ISPIM系统,主动采集频率为45min,监控指标可达150W+,覆盖智算平台内的所有设备。得益于浪潮信息ISPIM平台丰富、强大的功能,在部署浪潮信息的自动化运维解决方案后,中南大学智算平台不仅非常大程度上减轻了运维负担,算力的管控也更加集中化、智能化;同时,运维人员还可以通过浪潮信息ISPIM平台随时随地监控整个平台的运作时的状态,实现能耗可查、可管、可控。另外,由于ISPIM平台故障报警能够以秒级的速度精准定位,中南大学智算平台的高效有序运转从而得到了进一步的保障。

  在各行业领域数字化智慧化转型不断加快的情况下,大规模的公司或组织未来对大规模计算服务集群的需求还将持续增长,面对与之相伴的运维压力,浪潮信息将充分的发挥自身技术产品等优势,一如既往地为用户更好的提供全面综合IT运维管理解决方案。

  “元脑企智”EPAI(Enterprise Platform of AI),为企业AI大模型落地

  “元脑企智”EPAI /

  “源2.0系列基础大模型”已和最新的英特尔® 酷睿™ Ultra处理器

  与英特尔合作推出一种大模型效率工具“YuanChat” /

  澎湃技术认证。 经联合测试, 双方产品功能兼容性良好,整体运行流畅,性能表现优异,使用户得到满足在云计算、大数据、人工智能等领域对企业级数据存储的多种需求。

  澎湃技术认证 /

  廊全领域内环境和设备的全过程监控;利用传输层和数据层的传输和存储功能将海量数据提供给上层业务系统来进行大数据分析、实时控制、展示和应用。见图1 图1智慧

  希望通过此种方式与生态合作伙伴紧密互动,降低客户TCO (总体拥有成本)、缩减投产时间并促使产品和

  AS/HF系列新产品完全兼容,满足功能需求,系统运行可靠稳定,性能表现优异。

  集中式存储携手仪电云i-stack云操作系统软件完成兼容性认证 /

  云峦服务器操作系统keyarchOS满足兼容认证要求,整体运行稳定,在功能、性能及兼容性方面表现良好。

  澎湃技术认证 /

  ,与供应链及软件服务等生态合作伙伴共同构建的产品兼容性认证体系,包含“

  系统V8完成兼容性认证 /

  澎湃技术兼容性认证 /

  正式发布大模型智算软件栈 OGAI。OGAI (Open GenAI Infra)元脑生智,是为大模型业务提供AI算力系统环境部署、算力调度保障及模型开发

  澎湃技术相互兼容性测试认证 ,测试结果为,博雅云OneSRM SMP存储