朱 林
(中移互聯(lián)網(wǎng)有限公司,廣東 廣州 510640)
(1)人員精準管理。凡參與我司運維生產(chǎn)的人員,必須先在統(tǒng)一賬號管理系統(tǒng)進行造冊和實名認證,運維系統(tǒng)才能同步創(chuàng)建登錄賬號。
(2)賬號權限對接。統(tǒng)一賬號管理系統(tǒng)與各類運維系統(tǒng)對接,基于手機號碼和人員精準管理,實現(xiàn)運維賬號增刪改實時精準管理,通過集中化賦權,實現(xiàn)“千人千面”的權限管理體系。
(3)鑒權集中管理。通過移動認證、超級SIM(SIM快捷、SIM盾),實現(xiàn)鑒權集中管理,去除密碼管理;避免各類弱密碼、賬號混用、共用等問題,確保了運維生產(chǎn)的安全。
(4)登陸認證方式。在APP下通過統(tǒng)一認證實現(xiàn)快捷登錄,在PC環(huán)境下通過SIM快捷實現(xiàn)登錄,免去輸入冗長、復雜密碼導致登錄慢的問題,同時提升了運維生產(chǎn)效率和運維系統(tǒng)安全。
(5)短信小程序實現(xiàn)有效變更管理。基于短信小程序,事前推送變更計劃,業(yè)務方會簽駁回或同意;事中變更人員反饋開始操作,告警自動標示,變更完成后,業(yè)務方撥測并反饋撥測結果。撥測完成后,變更人員反饋變更結果。事后推送變更結果,了解變更結果及業(yè)務影響。
(6)短信小程序助力高效故障管理。基于短信小程序,故障發(fā)現(xiàn),開始處理故障,回復計劃采取的措施;故障跟進,查看業(yè)務影響情況及領導指示,反饋故障最新進展;故障修復,查看故障修復過程,查看各方的業(yè)務確認結果;故障總結,通報故障總結及評估結果,反饋故障閉環(huán)意見。
短信小程序、移動認證、工單H5審批的結合應用,提高了工單處理效率和安全性。通過工單短信提醒中嵌入工單H5審批鏈接,點擊短信中的審批鏈接,即可快速打開工單進行審批與處理,而且賬號與手機號碼綁定,更加安全快捷。
短信小程序、移動認證、綜合監(jiān)控的結合應用,提高了變更管理效率。對接統(tǒng)一賬號管理系統(tǒng),確保合規(guī)人員才能在線上提交、審批工單;基于移動認證能力,變更審批不可抵賴;在變更完成后,變更操作人員直接在移動端反饋變更結果,便捷高效。
2.2.1 事前
目的:通過會簽的方式,盡可能廣泛的征求變更操作的意見和建議,市場部及業(yè)務線條根據(jù)變更操作的業(yè)務影響及可能的業(yè)務影響進行可行性評估,駁回不宜開展的變更操作。
現(xiàn)網(wǎng)變更流程表單,增加值守人員字段及受影響業(yè)務情況子表,子表包括影響的業(yè)務線及對應的業(yè)務線接口人、撥測負責人、撥測結果;提單時由提單人判斷是否影響業(yè)務,如果影響,可選擇影響的業(yè)務線;選擇受影響的業(yè)務,則必須反饋業(yè)務撥測負責人;晚上20點,事前變更通告發(fā)送對象公司全體人員;在H5頁面展示當天計劃變更操作列表,點擊某個變更,可以查看變更詳情(操作人、操作時間、操作步驟、變更方案、審批流水、影響的業(yè)務范圍等)。
根據(jù)具體割接的時間和影響的范圍進行評估,市場部可能有重要的市場推廣活動,業(yè)務部門產(chǎn)品的版本升級與現(xiàn)有變更沖突,公司層面可能有重要保障任務等,以前的變更操作審批的范圍小,基本沒有進行跨部門會簽,而短信小程序發(fā)送面廣,在當天割接前,收到短信的公司領導及各部門領導、同事,在理由充分的前提下,可以駁回相關的變更操作,沒有駁回的變更操作,默認表示所有人會簽“同意”。
2.2.2 事中
目的:授權指定的操作人員,在指定的操作地點、時間,按照既定的操作方案和操作步驟開展變更操作,提升變更管理的規(guī)范化水平,盡可能減少業(yè)務影響。變更完成后,收集業(yè)務撥測和變更操作的結果。
到達操作計劃開始時間,系統(tǒng)自動發(fā)送短信給變更操作人員,該短信為變更授權短信,沒有這條短信的所有變更操作都是非法操作。變更操作人員通過短信小程序H5頁面,確認操作開始后,工程模式配置生效,對產(chǎn)生的告警進行標示;系統(tǒng)自動發(fā)送短信通知監(jiān)控中心和業(yè)務撥測負責人(如有),通知特定變更操作已經(jīng)開始,請密切關注。
變更操作完成,業(yè)務撥測負責人通過短信小程序H5頁面,反饋撥測結果,系統(tǒng)自動發(fā)送短信通知監(jiān)控中心及變更操作人員業(yè)務撥測結果;變更操作人員通過短信小程序H5頁面,確認所有受影響業(yè)務撥測完成,業(yè)務正常后,填寫變更結果及后續(xù)值守人員并關單,工程模式配置失效。操作流程如下:
(1)收到操作授權短信,反饋開始操作,告警自動標示。
(2)變更完成,業(yè)務方撥測并反饋撥測結果。
(3)撥測完成,變更人員反饋變更結果。
2.2.3 事后
目的:確認變更操作的業(yè)務影響,關注可能有業(yè)務響應的變更操作結果,及時反饋異常問題和情況。
早上9點系統(tǒng)自動下發(fā)短信小程序,短信發(fā)送對象是全體公司領導和同事,短信發(fā)送內(nèi)容是總的變更及各類變更的完成、成功、失敗、回退的數(shù)量以及故障情況(讀取故障管理模塊信息),H5頁面展示變更列表及具體變更詳情,特別是失敗的變更的影響時間和范圍。通過事后的變更結果通報短信小程序,公司所有領導和同事可以在上班的第一時間了解到當天凌晨所有變更的情況和結果,如果有業(yè)務異常或故障,可以及時對當天凌晨的變更操作進行關聯(lián)排查和分析,快速處理。
實現(xiàn)一人操作,一人授權。短信驗證授權有被攔截、泄露、借用的風險,SIM盾授權具有不可抵賴性,確保敏感操作的雙人機制,大幅提高運維生產(chǎn)的安全性,同時提升便利性。操作流程如下:
(1)網(wǎng)管系統(tǒng)監(jiān)測到操作包含危險指令,觸發(fā)SIM盾授權審批。
(2)授權人通過手機SIM盾進行操作授權或拒絕。
短信小程序、移動認證、精準人員管理的結合應用,實現(xiàn)千人千面的質(zhì)量管理。業(yè)務人員可以通過短信小程序在移動端靈活地查詢業(yè)務質(zhì)量指標運行情況,確保了合規(guī)的人員才有查詢權限,不同層級不同業(yè)務的人員擁有不同的查詢權限,每個合規(guī)人員只能查詢自己權限范圍內(nèi)的質(zhì)量數(shù)據(jù),方便快捷的同時,最大程度確保了信息安全。操作流程如下:
(1)從短信進入質(zhì)量管理查詢頁面,同時完成網(wǎng)關取號認證。
(2)移動認證+精準人員管理,合規(guī)人員可以查看達標及得分概況。
(3)根據(jù)賬號權限,查看賬號權限范圍內(nèi)的業(yè)務指標情況。
(1)故障發(fā)現(xiàn)。通過短信小程序通告有故障發(fā)生,并通過H5頁面通報故障影響范圍、當前處理人、故障等級的故障初步簡要信息,通知維護主責單位立即啟動故障排查工作,業(yè)務部門及客服部門反饋用戶投訴情況,監(jiān)控值班人員反饋告警信息及業(yè)務影響情況,知會領導進行指揮調(diào)度。用戶收到短信后,點擊鏈接完成取號認證,即可在H5頁面查看故障詳細信息,開始故障處理,回復計劃采取的措施。
(2)故障跟進。業(yè)務在收到故障發(fā)現(xiàn)短信小程序后,全面排查影響的業(yè)務和用戶數(shù)量,并在H5頁面上更新和反饋業(yè)務影響范圍;系統(tǒng)收到上述信息后,自動向負責故障處理的同事和領導發(fā)送業(yè)務影響信息通報的短信小程序;系統(tǒng)向故障處理人發(fā)送提醒短信,故障處理人員定時反饋故障處理進展;系統(tǒng)匯總相關處理信息后,發(fā)送關于故障進展通報的短信小程序。故障處理人員可直接在故障詳情頁面反饋最新的處理進展,其他用戶打開故障詳情頁面即可看到最新的處理情況。領導通過短信小程序“指揮調(diào)度”反饋指示意見,平臺收到反饋信息后,系統(tǒng)自動發(fā)送指揮調(diào)度(領導指示)的短信小程序。
(3)故障修復。故障進展顯示故障修復后,集中監(jiān)控中心開展業(yè)務撥測并反饋撥測結果,業(yè)務方確認和反饋各業(yè)務的恢復情況及恢復時間,故障處理人員反饋故障原因,系統(tǒng)收集到上述信息后,發(fā)送故障修復的短信小程序,通報業(yè)務恢復時間及故障原因。可以查看故障修復過程、各方的業(yè)務確認結果以及故障修復結果。
(4)故障總結。發(fā)布故障總結短信小程序,通報“故障是否監(jiān)控主動發(fā)現(xiàn)、是否超時、是否人為故障、是否變更引起、是否重復故障、故障原因、故障責任部門”等故障總結與評估結果。
基于移動認證、超級SIM、短信小程序等結合應用,在運維工作中的運維工單審批,質(zhì)量管理查詢、變更管理,敏感操作授權、故障管理等典型運維場景進行應用和實踐,有效提高了運維生產(chǎn)的效率和安全。