- 信息系统运行维护管理制度 推荐度:
- 相关推荐
信息系统运行维护管理制度
在不断进步的时代,越来越多人会去使用制度,制度是维护公平、公正的有效手段,是我们做事的底线要求。想必许多人都在为如何制定制度而烦恼吧,下面是小编收集整理的信息系统运行维护管理制度,欢迎大家分享。
信息系统运行维护管理制度1
第一章总则
第一条、为规范信息系统的运行维护管理工作,确保信息系统的安全可靠运行,切实提高生产效率和服务质量,使信息系统更好地服务于生产运营和管理,特制订本管理办法。
第二条、本管理办法适用于及其分支机构的信息系统,各分支机构和各部门可根据本办法制定相应的实施细则。
第三条、信息系统的维护内容在生产操作层面又分为机房环境维护、计算机硬件平台维护、配套网络维护、基础软件维护、应用软件维护五部分:
1、计算机硬件平台指计算机主机硬件及存储设备;
2、配套网络指保证信息系统相互通信和正常运行的网络组织,包括联网所需的交换机、路由器、防火墙等网络设备和局域网内连接网络设备的网线、传输、光纤线路等。
3、基础软件指运行于计算机主机之上的操作系统、数据库软件、中间件等公共软件;
4、应用软件指运行于计算机系统之上,直接提供服务或业务的专用软件;
5、机房环境指保证计算机系统正常稳定运行的基础设施,包含机房建筑、电力供应、空气调节、灰尘过滤、静电防护、消防设施、网络布线、维护工具等子系统。
第四条、运行维护管理的基本任务:
1、进行信息系统的日常运行和维护管理,实时监控系统运行状态,保证系统各类运行指标符合相关规定;
2、迅速而准确地定位和排除各类故障,保证信息系统正常运行,确保所承载的各类应用和业务正常;
3、进行系统安全管理,保证信息系统的运行安全和信息的完整、准确;
4、在保证系统运行质量的情况下,提高维护效率,降低维护成本。
第五条、本办法的解释和修改权属于行政人事部。
第二章运行维护组织架构
第一节运行维护组织
第六条、信息系统的运行维护管理遵循在统一的领导下,分级管理和维护的模式。作为信息系统维护管理部门,牵头组织分支机构实施信息系统的维护管理工作。原则上信息系统的维护工作应逐步集中。
第七条、信息系统的维护管理分两个层面:管理层面和生产操作层面。
1、在管理层面,为信息系统维护管理部门,负责公司范围内信息系统的维护管理和考核。
2、在生产操作层面,信息系统维护部门是运行中心和分支机构设置的实体或虚拟的维护部门(或维护人员)。信息系统维护部门直接对信息系统维护管理部门负责,并接受信息系统维护管理部门的业务指导和归口管理。
第八条、分支机构信息系统维护部门(或维护人员)可根据维护工作需要,向申请抽调技术人员和业务人员临时组成虚拟团队,参加分支机构设备巡检,制定技术规范、作业计划、应急预案,编制技术方案、培训教材等,各部门单位应积极配合。
第二节职责分工
第九条、信息系统维护管理部门职责
1、贯彻国家、行业及监管部门关于信息系统技术、设备及质量管理等方面的方针、政策和规定,组织制定信息系统的维护规程、维护管理办法和维护责任制度;
2、负责公司范围内信息系统运行维护管理、监督检查和质量考核评定工作,掌握运行质量情况,制定质量指标,并对信息系统各级维护部门进行定期检查考核;
3、负责管理、考核信息系统维保服务商(以下简称维保商),制定对维保商管理办法和考核指标,收集整理信息系统维护部门的反馈意见,督促相关维保商提高服务质量;
4、信息系统发生较大故障时,负责必要的资源协调和处理工作,并在事后组织分析总结,制定防范措施并推广;
5、组织各级维护部门、专业技术专家、维保商对信息系统进行定期巡检,巡检包括对信息系统及设备性能测试、维护人员日常维护作业计划执行情况检查、机房环境检查等;
6、负责归口管理公司范围内信息系统的优化、升级需求,组织编写相关方案并进行评审,方案获得批准后,及时通知相关业务管理部门、使用部门、技术部门组织实施;
7、负责组织信息系统维护技术培训、技术交流、联席会议,组织维护人员参加各种信息技术认证培训和考试,提高维护人员管理和技术水平;
8、负责组织落实各项技术安全措施,确保信息系统安全稳定运行;
9、负责对公司范围内信息系统故障管理、问题管理、变更管理、版本管理、配置管理等流程规范性和相关制度落实情况进行监督管理;
10、负责公司范围内信息系统的规划、设计和验收工作。
第十条、信息系统维护部门职责
1、负责公司范围内信息系统的计算机硬件平台、基础软件、应用软件、配套网络和的监控和日常维护工作,制定日常维护作业计划并认真执行,保证信息系统正常运行;
2、对于系统的所有维护(包括日常作业计划、故障处理、系统改进、数据变更、数据的备份与恢复、功能完善增加)都必须填写维护记录,每月向信息系统维护管理部门上报所辖范围内的信息系统运行情况和所有的维护记录;
3、负责所辖范围内信息系统数据的备份与恢复,负责落实系统安全运行措施;
4、负责所辖范围内信息系统档案资料的维护,及时更新有关资料;
5、严格按照信息系统故障管理、问题管理、变更管理、版本管理和配置管理等相关制度、流程和规程。
6、负责收集各级维护部门、厂商的故障分析报告、运维报告(日、月、季)、巡检报告、年度报告。认真审核报告内容,发现问题及时汇报上级主管部门,并协助整改。
7、按季度收集各信息系统使用单位对所有维护厂家的评分,进行季度考核。年底向各信息系统使用单位发放调查问卷,书面调查、征求各信息系统使用单位对各厂家维护服务等方面的评价意见,综合各方意见和季度考核,进行年度考核。
8、每年至少组织一次公司范围内的信息系统运维管理巡回检查,全面检查各维护作业计划管理、技术档案和资料管理、备份及日志管理、机房管理、安全保密管理等制度的落实情况。该检查可以和设备技术巡检同时进行。
9、组织召开故障分析会、维护例会,解决信息系统运行维护相关问题并负责持续跟踪。
第十一条、分支机构信息系统维护部门或维护人员职责
1、认真贯彻执行各项规章制度,落实维护规程和系统安全运行措施,负责制定所辖范围内的信息系统维护管理实施细则;
2、负责收集整理所辖范围内的信息系统运行质量情况,每月向信息系统维护管理部门上报信息系统运行情况和所有的维护记录;
3、配合信息系统维护管理部门参与所辖范围内信息系统运行质量分析,协助信息系统维护管理部门及时找出系统运行质量或效率下降的原因,提出改进建议,参与编写升级、扩容、实施、测试方案,并配合具体实施;
4、及时查阅上级维护管理部门下发的文件,按时完成上级维护管理部门交办任务,并向上级维护管理部门反馈执行结果;
5、协助信息系统维护管理部门进行所辖范围内的信息系统维保商的管理和考核;
6、负责所辖范围内信息系统的故障申告和服务请求。信息系统发生较大故障时,按照重大突发事件汇报路径上报上级主管部门;
7、负责组织和编制系统优化、升级需求,上报信息系统维护管理部门审核;获得批准后,参与实施;
8、组织对所辖范围内的信息系统进行定期巡检,落实配合人员,对巡检结果进行盖章确认,对发现问题进行整改。
9、负责所辖范围内信息系统的计算机硬件平台、基础软件、应用软件、配套网络和的监控和日常维护工作,制定日常维护作业计划并认真执行,保证信息系统正常运行;
10、对于系统的所有维护(包括故障处理、系统改进和功能完善增加)都必须填写维护记录,每月向信息系统维护管理部门上报所辖范围内的信息系统运行情况和所有的维护记录;
11、负责所辖范围内信息系统数据的备份与恢复,负责落实系统安全运行措施;
12、负责所辖范围内信息系统档案资料的维护,及时更新有关资料;
13、协助信息系统维护管理部门对所辖范围内信息系统的用户账号管理和数据安全管理,按照信息安全管理相关要求定期进行信息安全自我审核,每月向信息系统维护管理部门上报所辖范围内的信息系统信息安全情况。
第三节维护界面划分
第十二条、信息系统设备现场、物理环境的维护工作由所属机构的信息系统维护部门或维护人员负责。
第十三条、信息系统维护部门负责公司生产环境在线系统的监控和维护工作(包括日常作业计划、故障处理、系统改进、数据变更、数据的备份与恢复),维护和更新相应操作规范和技术文档。
第三章运行维护工作基本制度
第一节故障管理
第十四条、根据故障的影响范围及持续时间等因素,将故障分为特别重大故障(一级)、重大故障(二级)、较大故障(三级)、一般故障(四级)四个级别。
第十五条、系统出现故障,信息系统所在地维护部门或维护人员首先进行处理,同时判断系统类型和故障级别,根据系统类型和故障级别,故障处理应在要求的时限内完成,并同时向上级维护部门报告。
第十六条、故障升级要求
1、信息系统所在地维护部门处理不成功或无法自行处理,则向上级维护部门申告故障,根据系统类型和故障级别,故障申告应在要求的时限内完成。
2、信息系统故障受理部门受理各单位故障申告,紧急情况下,可以利用电话申告和受理,但事后必须补填故障受理单。
第十七条、信息系统维护部门对口故障处理人员接受故障派单后,应立即以电话、远程登陆等方式进行远程技术支持,必要时进行现场技术支持。对无法解决的.故障,应立即向软硬件最终提供商、代理商或维保服务商(以下简称厂商)提出技术支持申请,督促厂商安排技术支持,必要时进行跟踪处理,与厂商一起到现场进行解决。现场技术支持响应须在要求的时限内完成。
第十八条、厂商技术人员现场处理故障时,当地维护人员应全程陪同并积极协助,并在故障解决后进行书面确认。
第十九条、故障解决后,技术支持人员应立即向派单部门回单,派单部门对故障处理回单进行确认、评估,并通知申告单位进行业务验证。
第二十条、参与故障处理的各方必须如实、及时填写故障处理单,现场技术支持还须当地维护人员予以签字确认或维护部门盖章。
第二十一条、要建立重要紧急信息上报渠道,对于发生的重要紧急情况,应该立即逐级向上级主管部门报送,对业务影响较大的还应及时通知业务部门。
1、各级维护人员应拥有上级主管部门和相关业务部门的联系方式,包括电话、手机、传真等。
2、故障报告要求:发生较大(三级)或以上故障时,必须立即上报信息系统维护管理部门,如果是特别重大故障,应立即上报主管行领导。所有的较大(三级)或以上故障应在月度运维报告中进行记录,并在规定时限内向风险管理部门和内审部门提交故障分析报告。
第二十二条、对于系统隐患或暂时不能彻底解决的故障应纳入问题管理,每月应对存在的问题进行跟踪分析。
第二节问题管理
第二十三条、在信息系统运行维护中或在故障处理中发现的系统隐患或暂时不能解决的故障均列入问题库进行持续的跟踪管理。
第二十四条、问题可由任何人在运维例会、故障分析会、维护分析报告、巡检报告、运维管理平台上以多种形式提出,问题库的归口管理部门为信息系统维护管理部门。
第二十五条、问题一经提出,由归口管理部门组织讨论,明确问题的责任人、配合人员,制定解决方案、工作计划和时限要求。
第二十六条、问题责任人根据解决方案、工作计划组织开展工作,并按照工作计划进度要求向信息系统维护管理部门定期汇报工作进度。
第二十七条、问题责任人认为问题已经解决,应由提出人测试验证后,从问题库中删除,问题处理中产生的所有文档由生产配置管理员归档到运维管理平台的知识库中统一管理。
第三节变更管理
第二十八条、信息系统变更包括硬件扩容、冗余改造、软件升级、搬迁、数据移植、数据维护等工作以及电子表格模板、文档模板、安全策略、配置参数、系统结构、部署的改变等。
第二十九条、各级维护部门应保证在线系统的软件版本及硬件设备的稳定,未经过上级维护管理部门书面批准,不得自行对在线系统软件版本(简称在线版本)及硬件设备进行任何变更及调整。
第三十条、变更包括紧急变更和普通变更。紧急变更指由于业务开放或故障处理等的迫切需求而引起的,目的是保持或者恢复业务又无法书面申请、审批过程的变更。普通变更指非紧急变更,本管理办法中的变更,如果没有特殊说明,都指普通变更。
第三十一条、对于普通变更,由设备或系统所在地单位至少提前五个工作日书面提出变更申请,对于系统变更的依据、实施方案、风险控制和评估、测试方案以及回退方案进行详细列述,经上级维护管理部门书面批准后组织实施。
第三十二条、原则上,变更必须在夜间非主要业务时间进行,各维护实施单位应根据变更情况,按预先方案进行测试验证,验证通过后,以书面形式向上级维护管理部门汇报结果,并完成对相关文档资料(如应急预案)的更新。
第三十三条、对于紧急变更需求,允许口头申请、审批后组织具体实施。事后,对变更的安全性及功能性进行测试验证,将测试验证结果以及紧急变更事由、具体实施方案、实施过程等以书面形式报上级维护管理部门书面确认,并完成相关文档资料的更新工作。
第四节巡检管理
第三十四条、信息系统维护管理部门负责组织公司范围信息系统相关的机房环境、计算机硬件、配套网络、基础软件和应用软件的巡检,下发巡检通知,协调各分支机构、厂家的关系,管控巡检进度和质量。
第三十五条、信息系统维护部门负责本机构辖区范围内信息系统相关设备巡检的具体实施:
1、制定技术巡检计划,列出巡检重点、内容、要求,形成巡检检查表格;
2、收集设备运行故障和隐患。根据年度巡检重点、内容,调查设备近期运行情况,统计出各类型设备在运行过程中曾出现的故障。对反馈的问题进行分析、评估,做好相应的技术准备;对一些需要厂家解决的问题列出清单,及时与厂家沟通,制定解决方案,以供巡检过程中实施、解决。
3、确定巡检线路、时间,安排专业技术人员参加现场巡检,要求:
(1)到每个单位时,由各单位的科技联系人进行配合;
(2)到每个单位后,应先向其部门负责人汇报巡检工作安排,与其科技联系人交流、沟通,掌握当前各设备运行情况,了解系统存在的问题;
(3)检查各相关设备运行维护情况,解决设备运行问题,如实填写巡检表,列出发现并已解决的问题以及未解决的问题。对已解决的问题详细说明解决办法,对未解决的问题提交后续跟踪、处理的限时解决方案或建议;
(4)向当地维护部门负责人通报巡检情况,在取得其的同意下,签署意见并盖章确认。
4、巡检返回后十个工作日内,在各单位巡检表基础上整理一份巡检总结报告,提交信息系统维护管理部门。
5、组织相关技术人员对专业巡检情况进行分析,列出巡检过程中处理、解决的故障详细表以及未解决的故障详细表,进一步督促厂家限时解决遗留的故障和问题。
第五节备份及日志管理
第三十六条、对各项操作均应进行日志记录,内容应包括操作人、操作时间和操作内容等详细信息。各级维护部门维护人员应每日对操作日志、安全日志进行审查,对异常事件及时跟进解决,并每周形成日志审查汇总意见报上级维护主管部门审核。安全日志应包括但不局限于以下内容:
1、对于应用系统,包括系统管理员的所有系统操作记录、所有的登录访问记录、对敏感数据或关键数据有重大影响的系统操作记录以及其他重要系统操作记录的日志;
2、对于操作系统,包括系统管理员的所有操作记录、所有的登录日志;
3、对于数据库系统,包括数据库登录、库表结构的变更记录。
第三十七条、各级维护部门应针对所维护系统,依据数据变动的频繁程度以及业务数据重要性制定备份计划,经过上级维护主管部门批准后组织实施。
第三十八条、备份数据应包括系统软件和数据、业务数据、操作日志。
第三十九条、各级维护部门应按照备份计划,对所维护系统进行定期备份,原则上对于在线系统应实施每天一次的增量备份、每月一次的数据库级备份以及每季度一次的系统级备份。对于需实施变更的系统,在变更实施前后均应进行数据备份,必要时进行系统级备份。
第四十条、各级维护部门应定期对备份日志进行检查,发现问题及时整改补救。
第四十一条、备份介质应由专人管理,与生产系统异地存放,并保证一定的环境条件。除介质保管人员外,其他人员未经授权,不得进入介质存放地点。介质保管应建立档案,对于介质出入库进行详细记录。对于承载备份数据的备份介质,应确保在其安全使用期限内使用。对于需长期保存数据,应考虑通过光盘等方式进行保存。对于有安全使用期限限制的存储介质,应在安全使用期限内更换,确保数据存储安全。
第四十二条、各级维护部门应按照本级维护工作相关要求,根据业务数据的性质,确定备份数据保存期限,应根据备份介质使用寿命至少每年进行一次恢复性测试,并记录测试结果。
第六节安全保密管理
第四十三条、信息安全应满足国家、行业等各级监管部门和关于信息安全保密的各项规定及要求。
第四十四条、各应用系统维护部门负责本系统信息安全管理,根据系统特点,制定各应用系统的信息安全管理细则,在上级管理部门的指导下,具体开展应用系统的信息安全管理工作。
第四十五条、若发生系统信息泄密事件,各应用系统维护部门应及时向公司管理层进行汇报,并按照关于信息安全相关管理制度要求开展补救工作。
第四十六条、安全保密制度
1、联网设备必须采取必要的安全措施,以保障网络的设备安全及所承载业务的信息安全。在计算机上应安装防病毒软件,每天更新病毒库;
2、未经变更流程,严禁将业务系统与公众互联网进行连接;严禁未通过鉴权认证的拨号等形式接入信息系统;
3、在办公网络、生产网络与互联网或其他外部网络的网络连接处必须安装防火墙,并指定防火墙管理员,只有指定的系统(网络)管理员才能拥有防火墙管理帐号,未经批准,不得进行防火墙策略的更改;
4、严禁在生产系统中安装未经授权的软件;不得在生产系统上运行与工作无关的程序;未经批准,不得利用生产系统进行培训实习;
5、未经批准不得擅自抄录、复制配置资料、技术档案,内部资料不得泄露;
6、设备管理和维护人员都应熟悉并严格遵守和执行信息安全保密相关规定。
第四十七条、信息系统密码管理规定
1、对于操作系统、数据库、业务系统,系统(网络)管理员密码使用习惯应严格遵循如下要求:系统(网络)管理员每90天至少更换一次密码,密码的长度不小于8位、且同时包含数字和字母等字符,不得使用最近一次使用过的密码等;
2、各类用户在第一次登录时应进行用户密码修改,以后每90天至少修改一次用户密码,且不得使用最近使用过的密码,密码长度不得少于6位;
3、重要系统和敏感数据应存放于单机环境,由使用人员设定密码保护,防止非授权人员进行访问,密码位数必须在6位以上;如果存放在文档服务器上,需由信息系统维护部门建立文档服务器访问控制措施,并指定系统管理员;
4、严禁在各类系统中“将用户帐号和密码编写在程序中”的作法;系统中的帐号密码不得以明文方式存放;若存在以上系统隐患必须及时整改。
第四十八条、信息系统帐号管理规定
1、系统管理员帐号、系统维护帐号应保证一人一帐号,对于重要操作,可以由系统日志追溯到执行操作的帐号、直至相关操作人员。应严格控制系统超级用户帐号使用范围,能使用低级别帐号进行的操作禁止采用超级用户帐号实施。
2、各级应用、维护部门应合理划分用户组,并根据用户所承担职责合理划分用户权限。终端应用人员原则上要求每个员工一个帐号。
3、对于用户的增加、删除,用户权限的变更均需预先提出变更申请,在得到维护管理部门书面批准后由系统管理员负责实施。各应用、维护部门应定期组织对用户权限及分配情况进行审核,发现问题及时整改,并记录在案。员工离职或调离工作岗位后,应按照情况,及时对帐号和权限进行调整。
4、未经审批,维护人员不得登录数据库对业务数据进行直接操作。
5、对于由于操作系统、数据库平台等限制而使用的共享帐号,当使用此共享帐号的任一人员发生变更,必须修改密码,并保留密码变更记录。
6、供应商远程维护人员和系统开发人员不得拥有在线系统帐号。若因软件移植或系统维护需要,应事先经维护部门主管领导书面确认(紧急状态下应实现口头申请、事后补文字确认说明),方可临时授予开发人员操作帐号,并在维护人员全程陪同下进行相关操作,操作完成后,陪同人员负责完成对临时帐号的删除或禁止。供应商远程维护人员和系统开发人员对系统的所有操作均应通过日志记录,并予以备份保存。安全管理员应定期就“远程接入问题”进行重点审核。
信息系统运行维护管理制度2
1、总则
为保障公司信息系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。
运维工作总体目标:立足根本促发展,开拓运维新局面。
在企业发展壮大时期,通过网络、桌面、系统等的运维,促进企业稳定可持续性发展。
运维管理制度的适用范围:运维部全体人员。
2、编制方法
本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。
本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。
3、运维部工作职责
一、负责网站运维和技术支持
(一)根据网站运营战略和目标,负责网站整体架构、栏目、应用系统等技术开发方案制定和组织开发,保障网站技术的稳定性和先进性。
(二)负责网站栏目和应用系统的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决;
(三)网站设备和软件购买计划书的拟定,包括采购数量、品牌规格、技术参数。会同行政部进行采购。
(四)网站设备和软件操作规程和应用管理制度的制定,并负责监督执行。
(五)网站设备和软件安装、调试和验收,使用培训和维修保养。
(六)网站日常运行过程中信息安全和技术问题的协调解决,保障网站24小时安全稳定运行。
(七)网站技术服务外包管理,主要包括技术外包开发、运行服务托管和空间域名管理。
(八)负责网站管理系统及设备保密口令的设置和保存,保密口令设置后报中心主任备案,保密口令设定后任何人不得随意更改,保密口令每季度更新一次。
(九)负责网站新程序、新系统和网站改版升级方案技术的设计开发。
二、负责网站信息和技术安全
(一)执行国家和省上有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络,及时处理网站信息技术安全方面存在的问题,确保网站安全、稳定、可靠运行。
(二)网站信息技术安全保密制度和工作流程的制定,落实信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。
(三)在服务器和计算机之间设置硬件防火墙,在服务器及工作站上均安装防病毒软件,进行硬件和技术双保护,确保网站不受病毒和黑客攻击。
(四)负责网站信息技术安全应急处理预案制定和实施。
(五)安排专人监控网站各频道,各页面,各版块,各栏目信息内容,建立网站信息技术安全监控值班登记制度,发现问题及时处理,并登记问题和处理结果登记;
(六)建立多机备份网站信息服务系统机制,一旦主系统遇到故障或受到攻击导致不能正常运行,可以在最短的时间内替换主系统提供服务。
(七)建立网站系统集中式权限管理,按照岗位职责设定工作人员操作权限,针对不同应用系统、终端、操作人员,设置共享数据库信息的访问权限,并设置密码。不同的操作人员设定不同的用户名,且定期更换,严禁操作人员泄漏密码。
4、运维服务管理体系
运维服务管理体系规定了运维活动涉及的各类实体,以及这些实体间的相互关系。相关的实体按照运维服务管理体系进行有机组织,并协调工作,按照服务协议要求提供不同级别的IT运维服务。
4.1运维服务管理对象
运维服务管理对象包括基础设施、应用系统、用户、供应商、以及IT运维部门和人员,具体内容如下:
(1)基础设施包括网络、主机系统、存储/备份系统、终端系统、安全系统、以及机房动力环境等。
(2)应用系统包括内部办公系统、门户网站、面向公众的应用系统等。
(3)用户包括使用如上应用系统的用户。
(4)供应商包括基础设施和应用系统的供应商以及IT运维服务的供应商。
(5)运维部门和人员包括内部参与运维活动的相关部门和人员,以及提供运维服务的企业和相关人员。
4.2运维系统功能框架
根据建设单位的系统结构和业务开展需要,运维项目组将项目的维护框架分为9个具体组成部分,分别为:服务台、时间管理。工单管理、问题管理、变更管理、配置管理、工程师考核、知识库管理、统计、系统管理等9个子项。而具体运维流程将以此为依据开展工作。
4.3运维管理组织结构
本运维项目的运维管理结构位三层模式,具体如下图所示。由项目负责人与甲方进行业务范围接洽,并将沟通结果向下传递。项目经理负责项目的整体运维工作,包括各种制度的制定和实施。运维工程师则在项目经理的指导下开展维护工作。
4.3.1项目负责人
职责:负责项目商务、整体协调事宜。
职位描述:
(1)整体负责建设单位运维项目服务计划的制定,领导项目经理并安排项目工作,指导项目经理完成具体维护工作,每周听取项目经理的工作汇报,负责考核项目经理工作完成情况。
(2)协助建设单位完成新增项目的调研、方案设计并指导项目经理进行具体实施。
4.3.2项目经理
职责:规划、执行、完善信息化项目的运维工作,指导网络、数据库维护工程师开展工作。
职位描述:
1、根据公司战略目标,指导下属工程师开展客户服务工作,确保运维工作能够满足客户的实际需要;
2、建立和持续完善运维管理体系,优化运维流程流程,解决运维服务中出现的特殊问题;
3、规划并提升运维工程师专业服务能力,在整体上提高客户满意度;
4、制定和持续完善绩效考核体系;
5、制定整理运维项目的应急预案系统,并指导运维工程师实施;
6、提高自身专业技能,在业务方面给予网络管理员和数据库管理员指导。
4.3.3技术主管
职责:应用、数据库管理,oracle性能调优,实现应用负载均衡。
职位描述:
1、技术主管非项目常驻人员,根据项目需要进行专业方面指导;
2、负责数据库性能分析与调优,数据库运行状态监控,及时发现异常并快速处理。
3、熟练掌握Oracle10G的RAC技术,能够实现部署及调优。
4、掌握WAS、Weblogic、Tomcat、websphere等中间件的工作原理,能够实现部署调优及故障解决。
5、熟练掌握red—flag、redhat等linux操作系统,部署oracle10g、mysql数据库。熟练掌握dataguard技术,保证oracle数据库冗灾、数据保护、故障恢复。
6、负责应用负载均衡的部署和调试。
7、负责指导数据库工程师管理员开展工作。
4.3.4服务台
职责:故障电话受理,文档管理。
职位描述
1、负责业务的救助电话的受理工作;
2、故障处理的发起人,同时进行维护工程师指派,跟踪事件处理状态;
3、进行维护故障统计、用户满意度统计、工作报表输出等工作;
4、协助项目经理,进行文档整理、归类、保存等工作。
4.3.5网络管理员
职责:维护建设单位网络系统正常,解决网络相关故障。
职位描述:
1、对现有服务器、局域网络及机房、配线间的日常管理维护;
2、对信息安全建设提出相关建议,确保网络的安全;
3、保证外网光纤线路正常,保证局域网运行正常;
4、对网络系统和网络设备的运行状态进行监控;
5、熟练掌握域策略设置、DHCP、DNS、FTP服务器、NTFS权限设置等;
6、编写网络部分的应用处理预案并实施。
7、工作认真、细致,积极主动有条理性,具有良好的沟通能力及团队合作精神、4.3.5应应用、数据用、数据库库管理管理员员
职责:维护建设单位业务系统运行正常,解决应用和数据库故障。
职位描述:
1、监测业务系统运行状况,应用、数据库性能监视及优化,作必要调整;
2、规划不同数据的生命周期,制订备份、恢复、迁移和灾备策略,根据业务的需要执行数据转换及迁移等操作;
3、保证应用和数据库系统的安全性、完整性和运行效率。
4、负责数据库平台的整体架构及解决方案的制定和实施;
5、工作认真、细致,积极主动有条理性,具有良好的沟通能力及团队合作精神
4.3.7终端管理员
职责:维护建设单位桌面系统运行正常,解决终端、外设故障。
职位描述:
1、各部门电脑、打印机、传真机的维护;
2、对各部门职员进行电脑相关的技术支持及培训工作;
3、精通WindowsXP及Office的使用,能够熟练使用Excel20xx、Excel20xx及以上版本,能够制作相应教程对其他部门员工进行培训
4.4运维服务流程
IT运维服务管理流程涉及服务台、事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、财务管理、能力管理、可用性管理、服务持续性管理、知识管理及供应商管理等,随着运维活动的不断深入和持续改进,其他流程可能会逐步独立并规范。
4.4.1项目运维服务工作流程图
4.4.2服务台
服务台是支持运维服务的核心功能,与各个流程联系密切。所有管理流程都要通过服务台为用户提供单点联系,解答用户的相关问题和需求,或为用户寻求相应的支持人员。
在本系统中,服务台是接收各种来源服务请求和相关信息反馈的唯一入口和出口,同时服务台还负责一般请求、通过知识库(历史事件)能够解决的请求;他也是复杂问题二线处理的桥梁。
4.4.3事件管理
事件管理流程的主要目标是尽快恢复服务提供并减少其对业务的不利影响,尽可能保证最好的服务质量和可用性等级。事件管理流程通常涉及事件的侦测和记录、事件的分类和支持、事件的调查和诊断、事件的解决和恢复以及事件的关闭。
本系统把所有服务请求和报警归结为事件。事件管理是提供服务台和事件管理者对于事件记录、处理、查询、审核、派发等功能。它也包括通过和第三方监控系统对接,把其发送报警形成事件的功能。
4.4.4工单管理
工单管理:工单是现场运维、二线支持的任务载体,运维工程依据所接收工单进行运维工作。工单管理是对工单实现创建、变更、查询浏览、派发、监督等功能的模块。
4.4.5问题管理
问题管理流程的.主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小。问题管理流程包括诊断事件根本原因和确定问题解决方案所需要的活动,通过合适的控制过程,尤其是变更管理和发布管理,负责确保解决方案的实施。问题管理还将维护有关问题、应急方案和解决方案的信息。
问题管理是针对已处理事件的遗留问题或处理事件的方案只是治标不治本的不能彻底解决问题而考虑的模块。根据事件、及处理方案,问题处理人经过调查、诊断并提出最终解决方法。
4.4.6变更管理
变更管理实现所有基础设施和应用系统的变更,变更管理应记录并对所有要求的变更进行分类,应评估变更请求的风险、影响和业务收益。其主要目标是以对服务最小的干扰实现有益的变更。
变更管理是要对重大资源的新增、变更、升级等运维活动进行审核的功能,以免这些活动对现有资源的可用性造成没有必要的影响和破坏;同时,他还要实现在工单中产生的变化进行后审计的功能。
4.4.7配置管理
配置管理流程负责核实基础设施和应用系统中实施的变更以及配置项之间的关系是否已经被正确记录下来;确保配置管理数据库能够准确地反映现存配置项的实际版本状态。
配置管理实际上是全部资源的统一管理的功能,包括资源整个生命周期的参数或配置的变化记录的管理。管理信息主要涉及分类、型号、版本、位置,状态、相关资料等基本信息还包括核心参数等
4.4.8知识库管理
知识库管理:知识库是提供给运维人员重要的技术资料内容,他汇集在工作的遇到的典型案例归纳总结的知识要点和全面实用资料手册。在本系统中,知识库管理提供便于使用的人机接口、快速查询的技术手段和维护手段。
4.4.9统计及工作报告
运维管理系统提供一线解决率统计、客户满意度统计、按分类的事件汇总统计、工作报告生成的功能,按照一定格式根据事件数据、工单数据、问题数据、配置数据、变更数据可以帮助运维管理者能把运维的所做的工作内容清晰的罗列出来。
5、运维服务内容
5.1服务目标
运维项目组提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。
用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:
运行状态、故障情况
配置信息
可用性情况及健康状况性能指标
5.2IT资产统计服务
服务内容包括:
硬件设备型号、数量、版本等信息统计记录
软件产品型号、版本和补丁等信息统计记录
网络结构、网络路由、网络
IP地址统计记录
综合布线系统结构图的绘制
其它附属设备的统计记录
5.3网络安全系统运维服务
从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。
设备基础性能检测:cpu、内存使用情况监测;
设备日志查看;
设备snmp状态;
测试Ping,tracert等工具的连通性;
网络安全策略应用是否正常;
Internet带宽流量的实时监测;
网络拓扑链路状态监测;
异常网络数据包流量;
Dos、ddos等网络攻击情况监测;
Internet线路的误码率、丢包率监测;
5.4主机、存储系统运维服务
提供的主机、存储系统的运维服务包括:主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。
进行监控管理的内容包括:
CPU性能管理;
内存使用情况管理;
硬盘利用情况管理;
系统进程管理;
主机性能管理;
实时监控主机电源、风扇的使用情况及主机机箱内部温度;
监控主机硬盘运行状态;
监控主机网卡、阵列卡等硬件状态;
监控主机HA运行状况;
主机系统文件系统管理;
监控存储交换机设备状态、端口状态、传输速度;
监控备份服务进程、备份情况(起止时间、是否成功、出错告警);
监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;
对存储的性能(如高速缓存、光纤通道等)进行监控。
5.5数据库系统运维服务
提供的数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能发生的问题。
进行监控管理的内容包括:
数据库基本信息:文件系统、碎片、死锁、CPU占用率较大或时间较长的SQL语句。
表空间使用信息监测;
数据库文件I/0读写情况;
Session连接数量监控;
数据库监听运行状态监测;
查看每日数据备份、数据同步是否正常;
报警日志监测;
对表和索引进行Analyze,检查表空间碎片;
检测数据库后台进程;
数据库对象的空间扩展情况监测;
5.6中间件运维服务
中间件管理是指对BEAWeblogic、tomcat、MQ等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行。中间件监控指标包括配置信息管理、故障监控、性能监控。
执行线程:监控中间件配置执行线程的空闲数量。
JVM内存:JVM内存曲线正常,能够及时的进行内存空间回收。
JDBC连接池:连接池的初始容量和最大容量应该设置为相等,并且至少等于执行线程的数量,以避免在运行过程中创建数据库连接所带来的性能消耗。
检查中间件日志文件是否有异常报错
如果有中间件集群配置,需要检查集群的配置是否正常。
5.7终端、外设运维服务
负责对终端PC、笔记本以及工作站的操作系统、应用软件和硬件的维护,解决使用人员在应用过程中遇到的问题并进行简单培训,完成打印机等其他外设的故障处理工作。
6、应急服务响应措施
运维项目组制定了详尽的应急处理预案,整个流程严谨而有序。
但在服务维护过程中,意外情况将难以完全避免。我们将对项目实施的突发风险进行详细分析,并且针对各类突发事件,设计了相应的预防与解决措施,同时提供了完整的应急处理流程。
6.1应急预案实施基本流程
已解决
扩大应急
发现故障
启动应急预案,并通知领导
按事件流程处理
初步判定
故障恢复
联系技术支持处理
联系开发人员或厂家工程师现场处理
一般事件
突发事件
总结,修订应急预案
已解决
未解决
突发事件
应急组
未解决
已解决
汇报进度
汇报进度
汇报
增援
记录
6.2突发事件应急策略
(1)值班人员平时应做好应急事件的监控工作,对于突发事件应认真分析、准确判定故障发生的数据域,负责跟踪该事件直至其结束。
对于不在运维中心的故障,应在第一时间内通知负责人去现场处理,密切关注事件流程及进展情况,并做好登记工作上报领导。
(2)正常情况下,要求值班人员在10分钟内进行事件确认。如果属于一般事件则按照事件流程进行分派处理,否则应迅速启动《应急预案》,并严格按照《应急预案》所规定的步骤快速实施应急处置,及时汇报上级领导,掌握实时处理情况。
(3)在处理过程中,如需其他部门去现场增援处理,应及时向上级领导部门汇报,协调沟通,尽快联系技术工程师或厂家技术支持赶赴现场援助处理。
7、服务管理制度规范
7.1服务时间
(1)在5*8小时工作时间内设置由专人职守的热线电话,接听内部的服务请求,并记录服务台事件处理结果。
(2)在非工作时间设置有专人7*24小时接听的移动电话热线,用于解决内部的技术问题以及接听7*24小时机房监控人员的机房突发情况汇报。
(3)服务响应时间:
故障级别响应时间
故障解决时间
I级:属于紧急问题;其具体现象为:系统崩溃导致业务停止、数据丢失。
10分钟,30分钟内提交故障处理方案小时以内
II级:属于严重问题;其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。
10分钟,30分钟内提交故障处理方案
小时以内
II级:属于较严重问题;其具体现象为:出现系统报错或警告,但10分钟,30分钟内提交故障12小时以内业务系统能继续运行且性能不受影响。
处理方案
IV级:属于普通问题;其具体现象为:系统技术功能、安装或配置咨询,或其他显然不影响业务的预约服务。
10分钟,2小时内提交故障处理方案
24小时以内
7.2行行为规为规范范
(1)遵守用户的各项规章制度,严格按照用户相应的规章制度办事。
(2)与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。
(3)出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。
(4)现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重。接听电话时要文明礼貌,语言清晰明了,语气和善。
(5)遵守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。
【信息系统运行维护管理制度】相关文章:
信息系统运行维护管理制度(通用10篇)01-27
设备运行维护管理制度08-29
设备运行维护管理制度[经典3篇]10-24
计算机系统运行维护管理制度04-26
设备设施运行维护管理方案03-15
本科生运行维护岗位实习报告02-12
运行、检修管理制度10-20
维护与管理制度05-28
电站运行管理制度02-21
生产运行管理制度04-06