新闻中心
华体会娱乐体育首页

【案例集】金融行业IT运维精选案例集

发表时间:2024-04-23 02:37:34 来源:华体会娱乐体育首页

  IT运维指,依据业务需要规划信息、网络、服务,利用互联网监控、事件预警、业务调度、排障升级等手段,使服务处于长期稳定可用状态。IT运维范围涵盖网络、服务器、系统、环境、应用、监控、虚拟化、容器化、自动化、智能化等众多领域。运维体系经历了从人工运维到自动化运维的转变,正迈向智能化运维的新阶段。

  对于金融行业来说,运维是科技管理的核心和重点工作,是金融企业数字化转型的助推器,关键信息基础设施的稳定运行需要更规范、标准化的运维能力,核心业务需求的快速响应需要更高效、自动化的运维能力,产业跨界融合发展需要更立体、平台化的运维能力。央行《金融科技发展规划(2022-2025年)》提出,建立健全金融数据中心智能化运维机制,加强多场景协同联动、多节点一体管控,提升节点感知、异常发现和故障预测能力,降低人工操作风险,推动运维管理模式转变发展方式与经济转型。是保障金融业务稳定运行的关键环节。银保监会下发的《关于银行业保险业数字化转型的指导意见》中,提到要建立“前端敏态、后端稳态”的运行模式,同时还需建立能快速响应需求的敏捷研发运维体系,积极引入研发运维一体化工具等科技能力建设。

  金科创新社收集、归纳、整理了近年来金融行业 50个IT运维案例,按照云运维、应用运维、系统运维、运维开发、运维安全等内容做分类,以期推动金融IT运维从传统运维向智能运维转型,探索运维新模式,实现运维更高效、更安全并可持续的业务目标,助力金融数字化转型构筑坚实数字底座。

  金融行业云计算、虚拟化技术的发展,给运维带来新的挑战:一是资源池基础架构多样,异构资源池难以有效的统一管理与调度;二是业务系统上云后,管理理念、技术工具、业务流程未充分融合,导致在提升效率,释放IT人力资源的效果并不明显;三是数据中心云化后,资源快速部署,自助交付效率慢慢的变成为瓶颈。光大证券、北京农商银行、贵州农信等金融机构在多云异构管理、灾备云建设等方面做了有益探索。

  光大证券数智化数据中心多云管理平台(MCMP)实现多云(私有基础设施云、桌面云、容器云和公有云)服务和资源的统筹管理。MCMP在多云异构资源池管理、跨云资源调度和编排、智能管控、统一自助交付及运营管理五个功能领域提供了“自助、敏捷、开放”运营一体的服务能力。

  云平台创新项目通过构建标准化、完整的IaaS、云平台、规范、流程, 建立起标准化、自动化,支持快速开发测试与管理的一体化云平台, 屏蔽异构的底层硬件复杂环境,实现了在混合IT环境下统一部署交付混合IT资源和环境, 统一部署交付各类应用业务系统。

  云平台项目采用成熟度较高的商业云计算平台产品,形成具有本行特色的商业云计算落地最佳实践,制定了一体化管理框架;采用多台服务器实现分布式存储以及计算与内存池化,提高了系统的可靠性、可用性、可扩展性和存取效率;建立了IAAS+的私有云平台,形成资源层、平台层灵活调度的敏捷环境,为开发测试提供了快速可靠的IT资源交付服务。

  云管理平台通过负载均衡和资源均衡的策略,从共享资源池中为上层的应用系统创建和提供运行环境。其总体架构设计可分为:硬件基础设施层、云资源调度层、云资源服务层以及云资源应用层。通过采用实时高效能耗监控和管理技术、资源智能运维技术,实现了云计算环境资源能效管理和智能运维。

  金融企业业务、科技的加快速度进行发展,应用系统、数据量、IT基础设施数量和规模慢慢的变大,系统间关联关系越来越复杂,操作风险、运维成本、应急能力等诸多问题日渐显现,应用运维以保障生产系统安全稳定运行为目标,通过优化线上服务的发布变更、服务健康情况监控、服务的容灾高可用和数据安全备份等工作,不断的提高运维精细化水平。珠江人寿、农信银资金清算中心、福建农信等金融企业在业务运维平台、日志分析平台、自动化运维方面的创新经验值得借鉴。

  智能业务运维平台包含应用性能分析、用户体验分析、可视化分析数据展示、统一运维门户等功能,支持监控系统底层代码、系统内部及系统间接口的调用链,实现端对端的数据链路分析,从而形成完整系统拓扑图,实现系统性能分析及系统定位故障。

  平台主要实现以下关键目标:一是应用性能分析,通过一系列分析实现对移动互联网服务系统、业务支撑系统的运行性能与故障状况做实时的监控与定位,对问题进行提前预警与实时告警;二是用户体验分析,通过采集、统计与分析每位用户使用系统的性能状态,主动掌握用户在使用系统过程中出现的异常问题,先于用户发现并处理问题,提升服务质量与提升使用者真实的体验;三是业务健康度分析,通过对关键业务的业务量、业务健康情况做分析,为业务部门进行业务流程的优化、制定经营销售的策略等提供决策依据;四是可视化数据展示,通过可视化技术展示监控对象的关键运行数据,如系统拓扑图、业务健康度数据、系统故障数据、基础资源使用情况数据等。

  农信银支付清算系统覆盖全国8万家农村中小金融机构的业务网点,其所提供的金融服务惠及近10亿农村地区用户。覆盖全机构业务系统的实时日志分析平台,通过日志分析加强业务运维支撑能力。

  自动化运维系统是以流程管理为核心,以保障安全和提升效率为理念,系统包括作业调度、应急操作、健康巡检、灾备切换、脚本服务、文件同步等功能模块。项目立足于解决IT运维中的痛点,着力实现运维操作标准化、管理精细化,提升运维服务水平,主要在以下方面做了创新:一是实现作业可视化、集中管理,通过对各类定时作业、批量作业进行梳理,经过流程化改造接入自动化运维系统,将分散在各个应用系统的服务器的批量作业集中管控;实现作业开发配置可视化,运行结果监控可视化,异常处理处置流程规范化,关联作业可设置依赖关系;作业支持集群调用,规避作业单点风险。二是实现自动化灾备切换,通过自动化运维系统实现灾备切换的自动化,解决手工操作,切换时间长,切换效率低的问题,大大降低RTO;实现灾备切换过程可视化,切换风险可控;实现灾备切换流程可固化,切换执行步骤、脚本可集中管控,使得切换的知识、经验可传承。三是实现环境一致性,通过文件同步模块实现可视化界面,进行环境同步配置和同步状态实时展示与监控,有效确保灾备环境的可用性。

  数字化转型慢慢的变成了金融企业保持竞争力、拓展业务边界的必经之路。这让数字底座的金融IT基础设施运维面临海量数据、架构转型等挑战。系统运维聚焦基础服务和底层网络,关注性能、可用性、稳定性及负载调度能力等,前海人寿、兴业银行等金融机构自动化、智能化运维实践带来有益的思考和启发。

  162自动化运维平台综合利用了风险管理、质量管理、大数据分析及多种新技术,以活动事务过程管控为基础,发挥IT系统运行数据积累优势,对运行风险诱因来管理,化被动为主动,构建了一个过程治理数据、数据驱动流程、流程驱动管理、管理促进规范的服务管理闭环。

  平台承载超过200多个应用系统的管理支持工作。其中,ARMS应用资源管理系统,管理涉及基础设施类、应用系统类、信息安全类等应用基础资源数千项;ODAP运营数据分析平台,日分析上亿数据量,产生近200张各类型清单报表,涉及指标分析、IT服务、监管审计、监控分析、安全与桌面、版本分析、定采需求等;ASM应用监控平台,实施监控目标作业数千个,预警消息推送及监控告警超过1000笔/天,主动及时有效地发现大量的生产问题隐患并推动问题解决;IT服务管理系统通过ITSM处理IT服务事件、权限作业、生产异常、变更请求、数据处理等超过1000笔/月。

  一体化智能运维平台是将兴业银行福州中山机房、马江机房、上海张江机房及各分行的主机、服务器和网络等各种生产设备和各地运维人力资源纳入到统一的运维平台来管理,以提高全行运行维护的的可靠性和安全性的实践。

  该平台的建设完善了兴业银行完整的运维授权访问控制体系,实现运维人员身份认证、运维操作和访问控制、设备密码的统一管理,实现了集中的用户访问痕迹跟踪和审计,实现跨区域、跨机房维护,提高了运维工作效率,保障了全行各信息系统安全、稳定、高效运行。

  随着金融业务的快速地发展,以及大量新技术的引入,对传统的运维管理方法提出挑战。在高速变化的环境下,系统怎么样保持可用性要求,需要有更先进的IT管理思路和更高效的运维管理平台。运维开发指运维平台设计、开发和实施部署,郑州银行、哈密商业银行、江西农信等金融企业在DevOps、统一运维管理平台、智能运维平台方面做了创新实践。

  项目主要内容有规划和搭建应用容器云平台(DevOps环境)及其管理端。容器云平台采用云原生开源的K8S+Docker技术,根据应用需求,搭建开发测试集群、DMZ集群、互联网应用集群3套业务集群,并通过管理平台实现统一管理。在开发测试中心的开发测试区、DMZ区、互联网应用区各搭建1套高可用集群,实现互联网应用区的应用通过DMZ区暴露到外部访问,并在开发测试区和互联网应用区均提供共享存储,满足集群应用的数据持久化需求。所有集群共同使用同一镜像仓库。管理平台可以对多集群进行统一的可视化管理,提供多集群的注册、修改、运维、监控等核心功能支持,实现多集群的一站式管理。

  IT运维管理平台实现一套管控体系、一套低代码与运维开发方法;通过建立统一运维管理平台,整合贯通CMDB、流程平台、监控平台、运维数据分析、知识库、门户及可视化等,实现企业IT运维工具化、可视化、标准化、数字化、一体化的体系化演进。

  哈密银行采用数字化驱动运维战略,底层依托大数据平台的算力,实现运维数据的采、存、管、析、用,从监、管、控三方面整体提升运维能力。建立监控体系使监控平台覆盖运维全领域,实现运维数据数字化,并围绕CMDB配置管理作为主数据,建立指标、日志、告警、工单等统一运维大数据模型。基于可视化、低代码的编排设计引擎界面,实现对数据接入、数据标准、数据治理、数据消费、算法服务的闭环,进而提供可视化、白盒化的数据算法和训练能力。构建面向业务视角的数据地图和服务目录,促进数据的分析消费和深度挖掘,大幅度的提高运维数据资产的价值,提高问题处理的效率。

  智能运维平台的整体系统架构采用Hadoop和Elasticsearch作为存储和计算的支撑平台,开放式的智能模型架构提供智能能力输出,通过基于微服务与分布式消息的运维管理总线为主线,搭建而成。

  功能上,实现应用系统交易智能分析、企业级系统智能感知、企业级数据库智能洞察、企业级运维智能提升、企业级存储智能评估。

  技术创新上,一是为满足业务日志采集实时性、高吞吐量以及系统资源低消耗的要求,对Flume在源码层面进行大量改造和验证,保障数据采集层长期稳定运行;二是应用微服务设计理念,数据解析实现完全的配置化定义,并对外以RESTful接口提供调用,快速响应客户的真实需求的变化;三是结合缓存集群以及Structured Streaming的使用,完成如交易日志合并、异步消息处理等复杂业务逻辑的实现;四是整个运维大数据平台基于虚拟化平台构建,具备完全的资源动态扩容与调整能力。

  近几年来由于运维管理不当造成金融机构信息科技风险事件时有发生。运维安全负责各方面的安全加固工作,如安全扫描、渗透测试等,进行安全工具和系统研发以及安全事件应急处理,对于信息科技风险的有效控制和管理至关重要。

  平台将安全业务自动化处理与数据深度挖掘相结合,优化企业安全处理过程,结合人、资产、威胁、法规政策等相关因素,做到真正的移动业务风险管理。大数据技术使原有被动式的事前策略预防,事中处理和事后审计流程,转为更加主动的自动评估预测与智能检测加固防护,帮企业安全管理部门实现从追求功能价值到追求数据价值的核心诉求。

  平台主要包含数据感知中心、数据流程中心与数据展现中心三个基本功能模块,数据感知中心集成行业最先进的源代码安全测试、应用安全检测、基础环境漏洞扫描、基础环境安全配置核查、Web安全检测工具等,对于具体的移动业务自动进行安全感知数据搜集。数据流程中心与前后端主流管理软件jenkins、DevOps、OpenStack、项目管理系统等平台数据交互,形成以安全漏洞视角为核心的问题处理流程管理机制,对于问题进行过程管控与预警通告,同时建立以零日威胁防护为目标的应急响应机制。数据展现中心则将安全过程数据、安全生产数据与安全结果数据来进行业务建模与数据挖掘,提供业务安全评估、已知风险统计、业务安全溯源与安全态势预测的深度数据服务。展现中心特有的数据量化展现工具,可与现行政策法规与企业安全基线相结合,形成问题源、风险关联、事件过程与态势影响的企业实时全景安全监控。

  为加强科技风险防范能力,提升运维管理上的水准,吉林农信结合自己运维体系的建设情况,以客户体验为中心,利用模拟仿真、自动化技术,建立业务拨测系统,对业务进行监控,避免业务故障发现、处理不及时,影响客户满意程度进而造成客户流失;实现及时、有效获取系统可靠性指标(可用率、MTBF、MTTR、MTTF等重要指标);增加主动监控维度,驱动现有监控体系形成良性、自优化闭环体系;形成应用系统级别的故障定位,及构建业务故障影响区域快速判定方法;弥补现有运维体系存在短板,解决交易监控系统夜间无交易情况下的盲区。

  注:金融行业IT运维精选案例集来源于金科创新社近年来主办、协办的评选活动及网络。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  全球颜值“天花板”,仅售9万配大溜背+电尾,还有2.0T+9AT强动力

  二等奖井喷245注,大乐透第24045期头奖开11注,云南彩民独获3注

  1-0!绿军22三分平纪录大胜热火 塔图姆23+10+10季后赛首次三双

  新消费日报 雷军称着急购车可选购智界S7等;泡泡玛特Q1营收同比增长40%-45%;钟薛高创始人林盛回应被限高……

  当一岁多小男孩遇上裙子全身都在表达抗拒“没强制孩子穿 也有跟孩子道歉解释”