了解最新公司動態(tài)及行業(yè)資訊
第一章總則
運維的目標是在服務異常時盡快恢復服務,保證服務的可用性; 同時深入分析故障原因; 促進和修復服務中存在的問題,并設計和制定相關方案,確保服務故障得到保障。 高效補貨。
第一條 為保證信息系統(tǒng)軟硬件設備的良好運行,使運維人員工作制度化、流程化、規(guī)范化,特制定本制度。
第二條運維管理的總體目標:立足根本促進發(fā)展,開創(chuàng)運維工作新局面。 在辦公系統(tǒng)運行推廣期,只有通過網(wǎng)絡、桌面、系統(tǒng)的運維,才能促進信息系統(tǒng)的穩(wěn)定、持續(xù)發(fā)展。
第三運維管理系統(tǒng)適用范圍:所有運維人員。
第二章編制方法
第一條 本實施細則包括運維服務全生命周期管理方法、管理規(guī)范/規(guī)范、管理模型、管理支撐工具、管理對象、流程化管理技術等內(nèi)容。
第二條 本實施細則以ITIL/ITIL/信息化項目運維為目標,以管理支撐工具為手段,以過程化、規(guī)范化、規(guī)范化管理為手段,以PDCA以全生命周期循環(huán)為提升方式,展示運維服務全過程的系統(tǒng)化管理。
第三章運維部職責
第一條 系統(tǒng)運行維護及技術支持
1)根據(jù)公司業(yè)務的推進和發(fā)展目標,負責平臺信息系統(tǒng)管理和數(shù)據(jù)交換策略的總體架構,應用系統(tǒng)的基礎支撐和其他技術開發(fā)解決方案,確保穩(wěn)定性和先進性的基礎平臺。
2)負責系統(tǒng)基礎平臺的使用培訓和操作手冊的編寫,以及用戶在使用過程中出現(xiàn)的問題的溝通和解決;
3)結合項目實施,確定系統(tǒng)信息基礎設施和軟件數(shù)量、品牌規(guī)模、技術參數(shù),確保項目有效推進實施。
4) 制定系統(tǒng)信息基礎設備和軟件操作規(guī)程、應用管理制度,并負責監(jiān)督實施。
5) 系統(tǒng)信息基礎設備的軟件安裝、調試和初步檢查,使用培訓和維修保養(yǎng)。
6)協(xié)調解決系統(tǒng)信息基礎平臺日常運行過程中的信息安全和技術問題,確保平臺24小時安全穩(wěn)定運行。
7) 負責平臺系統(tǒng)管理及設備安全密碼的設置、更新、保存。
8) 負責新程序、新系統(tǒng)、軟件改版升級的系統(tǒng)信息協(xié)同管理和協(xié)同數(shù)據(jù)交換策略研究。
第二條 平臺信息與技術安全
1)貫徹落實國家有關網(wǎng)絡信息技術安全的法律法規(guī),會同通信管理和網(wǎng)絡安全監(jiān)管部門,及時處理基礎研究平臺信息技術安全存在的問題,確?;A研究平臺安全、穩(wěn)定、可靠運行平臺。
2)建立信息技術安全保密制度和基礎運營平臺工作流程,落實信息技術安全保密責任制,落實“誰管、誰負責、誰負責”的原則誰承擔,誰負責”,責任到人。
3)在服務器和計算機之間設置硬件防火墻,在服務器和工作站都安裝殺毒軟件,進行硬件和技術的雙重保護,確保基礎研究平臺不受病毒和黑客的攻擊
4) 負責基礎運營平臺信息技術安全應急預案的制定和實施。
5) 構建多機備份基礎平臺信息服務體系機制。 一旦主系統(tǒng)出現(xiàn)故障或被攻擊而無法正常運行,可以在最短的時間內(nèi)更換主系統(tǒng)提供服務。
6) 構建基礎平臺系統(tǒng)的集中權限管理,根據(jù)崗位職責設置人員的操作權限,設置共享數(shù)據(jù)庫信息的訪問權限,設置不同應用系統(tǒng)、終端、操作人員的密碼。 不同的運營商設置不同的用戶名并定期更改,運營商禁止泄露密碼。
第四章運維服務管理體系
運維服務管理體系規(guī)定了參與運維工作的各個實體,以及這些實體之間的相互關系。 相關實體按照運維服務管理體系進行有機組織和協(xié)調,根據(jù)服務合同的要求,提供不同層次的IT運維服務。
第一個運維服務管理對象
運維服務管理對象包括基礎設施、應用系統(tǒng)、用戶、供應商以及IT運維部門和人員。 詳情如下所示:
1)基礎設施包括網(wǎng)絡、主機系統(tǒng)、存儲/備份系統(tǒng)、終端系統(tǒng)、安全系統(tǒng)、機房動力環(huán)境等。
2)應用系統(tǒng)包括OA辦公信息系統(tǒng)、門戶網(wǎng)站等應用系統(tǒng)。
3) 用戶包括使用上述應用系統(tǒng)的用戶。
4)供應商包括基礎設施和應用系統(tǒng)供應商以及IT運維服務供應商。
5)運維部門和人員包括內(nèi)部參與運維活動的相關部門和人員,以及提供運維服務的企業(yè)和相關人員。
第二條運維系統(tǒng)功能架構
根據(jù)建設單位的體系結構和業(yè)務需求,運維項目組將項目維護框架劃分為9個具體的組件,分別是:服務臺和時間管理。 工單管理、問題管理、變更管理、配置管理、工程師評估、知識庫管理、統(tǒng)計、系統(tǒng)管理等。
第二條運維管理組織架構
運維項目的運維管理結構是三層模型。 項目負責人將與乙方商討業(yè)務范圍,并將溝通結果向上傳遞。 項目總監(jiān)負責項目的整體運營和維護,包括各項制度的制定和實施。 運維工程師在項目負責人的指導下進行維護工作。
第三條項目負責人
職責:負責項目業(yè)務及統(tǒng)籌協(xié)調。
職位描述:
1、全面負責建設單位運維項目服務計劃的制定,領導項目總監(jiān)并安排項目工作,指導項目總監(jiān)完成具體的維護工作,每周聽取項目總監(jiān)的工作匯報,以及負責評價項目總監(jiān)工作的完成情況。
2、協(xié)助建設單位完成新建工程的監(jiān)理設計,指導項目負責人進行具體實施。
第四篇項目總監(jiān)
職責:規(guī)劃、實施和完善信息化項目運維工作,指導網(wǎng)絡和數(shù)據(jù)庫維護工程師開展工作。
職位描述:
1、根據(jù)公司戰(zhàn)略目標,指導下屬工程師開展服務工作,確保運維工作滿足客戶業(yè)務實際需求;
2、建立并持續(xù)建立運維管理體系,優(yōu)化運維流程,解決運維服務中的特殊問題;
3、規(guī)劃和提升運維工程師的專業(yè)服務能力,整體提升服務滿意度;
4、制定并繼續(xù)建立績效考核體系;
5、制定運維項目梳理應急預案體系,指導運維工程師落實;
6、提高自身專業(yè)技能,對網(wǎng)絡管理員、數(shù)據(jù)庫管理員進行業(yè)務方面的指導。
第五條 技術監(jiān)督員
職責:應用程序和數(shù)據(jù)庫管理、數(shù)據(jù)庫性能調整和應用程序負載平衡。
職位描述:
1、技術主管不是項目常駐人員,根據(jù)項目需要提供專業(yè)指導;
2. 負責數(shù)據(jù)庫性能分析和調優(yōu),數(shù)據(jù)庫運行狀態(tài)監(jiān)控,及時發(fā)現(xiàn)異常并快速處理。
3、熟悉數(shù)據(jù)庫技術,能實現(xiàn)部署調優(yōu)。
4、掌握中間件的工作原理,可以實現(xiàn)部署優(yōu)化和故障排除。
5、熟悉linux操作系統(tǒng),會部署數(shù)據(jù)庫。 精通數(shù)據(jù)庫冗余、數(shù)據(jù)保護、故障恢復技術。
6、負責應用負載均衡的部署和調試。
7、負責指導數(shù)據(jù)庫工程師和管理員開展工作。
第六篇服務臺
職責:故障來電受理,文件管理。
職位描述
1、負責業(yè)務緊急呼叫的受理;
2、故障處理的發(fā)起者,同時指派維護工程師跟蹤故障處理情況;
3、進行維修故障統(tǒng)計、用戶滿意度統(tǒng)計、工作報表輸出等;
4、協(xié)助項目負責人整理、分類、保存文件。
第七條網(wǎng)絡管理員
職責:維護施工單位網(wǎng)絡系統(tǒng)的正常運行,解決網(wǎng)絡相關故障。
職位描述:
1、現(xiàn)有服務器、局域網(wǎng)、機房、配線室的日常管理和維護;
2.提出信息安全建設的相關建議,確保網(wǎng)絡安全;
3、確保內(nèi)網(wǎng)光纖線路正常,局域網(wǎng)運行正常;
4、監(jiān)控網(wǎng)絡系統(tǒng)和網(wǎng)絡設備的運行狀態(tài);
5、熟悉域策略設置、DHCP、DNS、FTP服務器、NTFS權限設置等;
6、網(wǎng)絡部分的應用解決方案的編制和實施。
7、工作認真細致,積極主動理性,具有良好的溝通能力和團隊合作精神。
第 8 條 應用程序和數(shù)據(jù)庫管理員
職責:維護建設單位業(yè)務系統(tǒng)的正常運行,解決應用和數(shù)據(jù)庫故障。
職位描述:
1、監(jiān)控業(yè)務系統(tǒng)的運行狀態(tài),對應用程序和數(shù)據(jù)庫的性能進行監(jiān)控和優(yōu)化,并進行必要的調整;
2、規(guī)劃不同數(shù)據(jù)的生命周期,制定備份、恢復、遷移和容災策略,根據(jù)業(yè)務需要進行數(shù)據(jù)轉換和遷移操作;
3. 確保應用程序和數(shù)據(jù)庫系統(tǒng)的安全性、完整性和運行效率。
4、負責數(shù)據(jù)庫平臺整體架構及解決方案的制定與實施;
5、工作認真細致,積極主動,理性,有良好的溝通能力和團隊合作精神。
第九條終端管理員
職責:維護施工單位桌面系統(tǒng)的正常運行,解決終端及外設故障。
職位描述:
1、各部門筆記本、打印機、傳真機的維修;
2、為各部門人員提供筆記本電腦相關的技術支持和培訓;
3.熟練使用 Linux和WPS辦公軟件,可以熟練使用
; 只能用MS軟件制作相應的教程,培訓其他部門人員。
第十條運維服務流程
IT運維服務管理流程涉及服務臺、事件管理、問題管理、配置管理、變更管理、發(fā)布管理、服務水平管理、財務管理、容量管理、可用性管理、服務連續(xù)性管理、知識管理和供應商管理等. ,隨著運維活動的不斷深入和不斷完善,其他流程可能會逐漸獨立和標準化。
第十一條服務臺
服務臺是支撐運維服務的核心職能,與各個流程密切相關。所有管理流程都應通過服務臺為用戶提供單點聯(lián)系,解答用戶的相關問題和需求,或尋找合適的用戶支持人員
第十二條風暴管理
風暴管理流程的主要目標是盡快恢??復服務提供并減少其對業(yè)務的不利影響,確保最佳的服務質量和可用性級別。 事件管理過程一般包括事件檢測和記錄、事件分類和支持、事件調查和診斷、事件解決和恢復以及事件關閉。
第十三條工單管理
工單管理:工單是現(xiàn)場運維和二線保障的任務載體,運維項目根據(jù)收到的工單進行運維工作。
工單管理是工單創(chuàng)建、修改、查詢、瀏覽、調度、監(jiān)管等模塊。
第十四條 問題管理
問題管理流程的主要目標是防止問題和崩潰的再次發(fā)生,并將未解決事件的影響降至最低。 問題管理過程包括診斷事件根本原因和確定問題解決方案所需的活動。 通過適當?shù)目刂屏鞒?,尤其是變更管理和發(fā)布管理,它負責確保解決方案的實施。 問題管理還將維護有關問題、解決方法和解決方案的信息。
問題管理是針對已經(jīng)處理過的剩余問題,或者應對風暴的解決方案進行考慮的一個模塊,只是治標不治本,不是解決問題的長久之計。 根據(jù)風暴和解決方案,問題處理者進行調查、診斷并提出最終解決方案。
第十五條 變更管理
變更管理對所有基礎設施和應用程序系統(tǒng)實施變更。 變更管理應記錄和分類所有必需的變更,并應評估變更請求的風險、影響和業(yè)務收益。 其主要目標是在對服務造成最小中斷的情況下實施有益的變化。
變更管理是對主要資源的新增、變更、升級等運維活動進行初步審查的功能,避免這些活動對現(xiàn)有資源的可用性造成不必要的影響和損害; 同時,必須實現(xiàn)在工單表單變更后進行事后審計的功能。
第十六條 配置管理
配置管理過程負責驗證在基礎設施和應用系統(tǒng)中實施的變更以及配置項之間的關系是否已被正確記錄; 確保配置管理數(shù)據(jù)庫能夠準確反映現(xiàn)有配置項的實際版本狀態(tài)。
配置管理實際上是對所有資源進行統(tǒng)一管理的功能,包括對資源整個生命周期的參數(shù)或配置變更記錄的管理。管理信息主要涉及分類、型號、版本、位置、狀態(tài)、相關資料等基本信息,還包括核心參數(shù)等。
第十七條 知識庫管理
知識庫管理:知識庫是提供給運維人員的重要技術信息內(nèi)容,匯集了工作中遇到的典型案例總結出的知識要點和全面實用的信息指南。 知識庫管理提供簡單易用的人機界面、快速查詢的技術手段和維護手段。
第十八條統(tǒng)計和工作報告
運維管理系統(tǒng)提供一線解決率統(tǒng)計、客戶滿意度統(tǒng)計、風暴分類匯總統(tǒng)計、工作報表生成功能。 風暴數(shù)據(jù)、工單數(shù)據(jù)、問題數(shù)據(jù)、配置數(shù)據(jù)、變更數(shù)據(jù)可以按照一定的格式,幫助運維管理者清晰的列出運維的工作內(nèi)容。
第四章運維服務內(nèi)容
第一條 服務宗旨
運維項目組提供的運維服務包括信息系統(tǒng)相關主機設備、操作系統(tǒng)、數(shù)據(jù)庫、存儲設備的運維服務,保障用戶現(xiàn)有信息系統(tǒng)的正常運行,增加統(tǒng)籌管理成本,并改善網(wǎng)絡信息。 系統(tǒng)的整體服務水平。 同時it運維技術,根據(jù)日常維護的數(shù)據(jù)和記錄,提供用戶信息系統(tǒng)的整體建設方案和建議,更好地為用戶的信息化發(fā)展提供有力保障。
用戶信息系統(tǒng)的構成主要可分為硬件設備和軟件系統(tǒng)兩大類。 硬件設備包括網(wǎng)絡設備、安全設備、主機設備、存儲設備等; 軟件設備可分為操作系統(tǒng)軟件、典型應用軟件(如:數(shù)據(jù)庫軟件、中間件軟件等)、業(yè)務應用軟件等。
服務項目范圍涵蓋的信息系統(tǒng)資源的關鍵狀態(tài)和參數(shù)指標:運行狀態(tài)、故障情況、配置信息、可用性和健康狀態(tài)性能指標
第二條資產(chǎn)統(tǒng)計服務
服務內(nèi)容包括:硬件設備型號、數(shù)量、版本等信息統(tǒng)計,記錄軟件產(chǎn)品型號、版本及補丁等信息統(tǒng)計,記錄網(wǎng)絡結構、網(wǎng)絡路由、網(wǎng)絡IP地址統(tǒng)計,記錄綜合布線系統(tǒng)結構及布局等。統(tǒng)計輔助設備記錄
第三網(wǎng)絡、安全系統(tǒng)運維服務
網(wǎng)絡系統(tǒng)的運維管理是從網(wǎng)絡連通性、網(wǎng)絡性能、網(wǎng)絡監(jiān)控管理三個方面來實現(xiàn)的。
設備基礎性能測量:CPU和內(nèi)存占用檢測; 設備日志查看; 設備 SNMP 狀態(tài); 測試 Ping 和其他工具的連通性; 網(wǎng)絡安全策略應用是否正常;
帶寬流量實時檢測; 檢測網(wǎng)絡拓撲鏈路狀態(tài); 網(wǎng)絡數(shù)據(jù)包流量異常; 檢測 Dos 和 ddos?? 等網(wǎng)絡攻擊; 檢測線路錯誤分辨率和丟包率;
第四條 主機及存儲系統(tǒng)運維服務
為主機和存儲系統(tǒng)提供的運維服務包括:主機和存儲設備日常監(jiān)控、設備運行狀態(tài)監(jiān)控、故障排除、操作系統(tǒng)維護、補丁升級等。
第五條 數(shù)據(jù)庫系統(tǒng)運維服務
提供的數(shù)據(jù)庫運維服務包括主動的數(shù)據(jù)庫性能管理,這對系統(tǒng)運維非常重要。 通過主動的性能管理,您可以了解數(shù)據(jù)庫的日常運行狀態(tài),找出數(shù)據(jù)庫性能問題發(fā)生的位置,有針對性地進行性能優(yōu)化。 同時密切關注數(shù)據(jù)庫系統(tǒng)的變化,主動預防可能出現(xiàn)的問題。
1、進行監(jiān)控管理
內(nèi)容包括: 數(shù)據(jù)庫基本信息:文件系統(tǒng)、碎片、死鎖、CPU占用率高或時間長的SQL語句。 表空間使用信息檢測; 數(shù)據(jù)庫文件I/0讀寫狀態(tài); 連接數(shù)監(jiān)控; 數(shù)據(jù)庫竊聽操作狀態(tài)檢測; 檢查日常數(shù)據(jù)備份和數(shù)據(jù)同步是否正常; 報告日志檢測; ; 測數(shù)據(jù)庫后臺進程; 檢測數(shù)據(jù)庫對象的空間擴展;
2.數(shù)據(jù)庫維護
也就是說,數(shù)據(jù)庫創(chuàng)建后的工作稱為數(shù)據(jù)庫維護。 包括備份系統(tǒng)數(shù)據(jù)、恢復數(shù)據(jù)庫系統(tǒng)、生成用戶信息表、授權信息表、監(jiān)控系統(tǒng)運行狀態(tài)、及時處理系統(tǒng)錯誤、保證系統(tǒng)數(shù)據(jù)安全、定期修改用戶密碼等。
三、需求驗收流程
1)產(chǎn)品組提出業(yè)務需求。
2)開發(fā)團隊分析需求,將需要修改的內(nèi)容反饋給運維團隊
3)運維組對需求進行分析和分類,包括變更、升級、維護數(shù)據(jù)庫等操作。
4)DBA將方案反饋給運維部審批,反饋風險評估結果。
5) 經(jīng)運維部門領導審批后,將方案報研發(fā)部門領導審批,反饋風險評估結果。
6) 經(jīng)研發(fā)部門領導批準后,DBA實施變更方案。
7)變更完成后,讓開發(fā)組協(xié)助驗證變更結果,同時測試組對測試功能進行驗證。
8)開發(fā)組驗證數(shù)據(jù)無誤,測試組驗證正常,DBA歸檔需求。
第六條 中間件運維服務
中間件管理是指對中間件如、ngnix等進行日常維護、管理和監(jiān)控,增強分析和解決中間件平臺干擾的能力,保證中間件平臺持續(xù)穩(wěn)定運行。 中間件監(jiān)控指標包括配置信息管理、故障監(jiān)控、性能監(jiān)控。
第七條 終端及周邊運維服務
負責終端PC、筆記本、工作站的操作系統(tǒng)、應用軟硬件的維護,解決用戶在應用過程中遇到的問題并提供簡單培訓,完成復印機等其他外設的故障排除。
第五章應急服務響應措施
運維項目組制定了詳細的應急預案,整個過程嚴謹有序。 但是,在服務維護過程中,無法完全避免意外情況的發(fā)生。 我們會詳細分析項目實施中的突發(fā)性風險,但對于各種突發(fā)性的風暴,我們都設計了相應的預防和處置措施,并提供了完整的應急處理流程。
第一條 應急預案實施的基本程序
二次風暴應急響應策略
1)值班人員做好應急風暴監(jiān)測工作。 對于突如其來的風暴,要認真分析,準確判斷故障發(fā)生的數(shù)據(jù)域,并負責跟蹤風暴直至結束。 對于非運維中心的故障,應第一時間通知負責人赴現(xiàn)場處理,密切關注風波過程和進展,做好處理工作登記并向領導匯報。
2)正常情況下,要求值班人員在15分鐘內(nèi)確認風暴。 如果是正常的風暴,應該按照風暴進程進行調度; 否則,要迅速啟動《應急預案》,嚴格按照《應急預案》規(guī)定的步驟實施應急處置,并及時向上級報告,掌握實時處理情況。
3)加工過程中,如有其他部門需要到現(xiàn)場支持加工,應及時向上級領導部門報告,協(xié)調溝通,并盡快聯(lián)系技術工程師或廠家技術支持,到現(xiàn)場協(xié)助處理。
第六章 服務管理體系規(guī)范
第一次服務時間
1) 設立熱線電話,專人值守,在5*8小時工作時間內(nèi)回答內(nèi)部服務請求,并記錄服務臺處理結果。
2)非工作時間設立聯(lián)通熱線電話,專人7*24小時接聽,用于解決內(nèi)部技術問題,通過7*24小時機房監(jiān)控,解答機房突發(fā)事件報告人員。
3)服務響應時間:
故障等級
響應時間
故障排除時間
I級:這是一個緊迫的問題; 其具體現(xiàn)象是:系統(tǒng)崩潰導致業(yè)務停止和數(shù)據(jù)丟失。
10分鐘、30分鐘
內(nèi)部提交失敗處理
計劃
3小時內(nèi)
II級:問題嚴重; 其具體癥狀為:部分組件出現(xiàn)故障,系統(tǒng)性能有所提升但仍能正常運行,不影響正常業(yè)務運行。
10分鐘、30分鐘
內(nèi)部提交失敗處理
計劃
6小時內(nèi)
Ⅲ級:問題較嚴重; 具體癥狀是:
10分鐘、30分鐘
出現(xiàn)系統(tǒng)錯誤或警告,但業(yè)務系統(tǒng)可以繼續(xù)
內(nèi)部提交失敗處理
12小時內(nèi)
繼續(xù)運行而不影響性能。
計劃
IV級:這是一個普遍的問題; 其具體現(xiàn)象是:
10分鐘,2小時
系統(tǒng)技術功能、安裝或配置咨詢,或
內(nèi)部提交失敗處理
24小時內(nèi)
他似乎并沒有影響預約服務的業(yè)務。
計劃
第二條行為準則
1) 遵守用戶規(guī)章制度,嚴格按照用戶相應規(guī)章制度行事。
2) 與用戶運維系統(tǒng)的其他部門和環(huán)節(jié)配合,密切配合,共同組織技術支持工作。
3)遇有疑難技術、業(yè)務問題和重大突發(fā)事件,及時向負責人報告。
4) 現(xiàn)場技術支持應精致、著裝、文明、談吐樸素。 接電話要文明禮貌,語言清晰it運維技術,語氣謙虛。
5)遵循保密原則。 對依托單位的網(wǎng)絡、主機、系統(tǒng)軟件、應用軟件等密碼、核心參數(shù)、業(yè)務數(shù)據(jù)等負責保密,不得隨意復制傳播。
編碼: