本刊記者|蔣雅麗
作為基礎(chǔ)網(wǎng)絡(luò)建設(shè)支撐者,運(yùn)營商的網(wǎng)絡(luò)故障是事故。面對(duì)像春節(jié)這樣的大面積并發(fā)流量,目前運(yùn)營商以及設(shè)備商的支持能力需要提高。
2月7日,正值大年初三,在走親訪友的高峰時(shí)期,吉林省部分地市的移動(dòng)用戶卻出現(xiàn)手機(jī)無服務(wù)現(xiàn)象。從當(dāng)天上午9時(shí)起,吉林移動(dòng)客服中心便陸續(xù)接到用戶投訴,反映手機(jī)業(yè)務(wù)無法使用。吉林移動(dòng)在第一時(shí)間啟動(dòng)應(yīng)急預(yù)案,70余名值守人員與專家前往現(xiàn)場進(jìn)行故障排查并處理,最后于10時(shí)30分起用戶通信業(yè)務(wù)陸續(xù)恢復(fù)。

據(jù)了解,此次通信故障波及吉林省長春市、松原市、四平市、吉林市4個(gè)地市,而且吉林省移動(dòng)卡在外地也沒有信號(hào),但外地移動(dòng)卡在吉林省卻可以正常使用。最初,吉林移動(dòng)公司工作人員稱,“移動(dòng)部分號(hào)段網(wǎng)絡(luò)升級(jí),導(dǎo)致手機(jī)卡暫無信號(hào),網(wǎng)絡(luò)預(yù)計(jì)恢復(fù)時(shí)間為當(dāng)天下午13點(diǎn)左右,無需到營業(yè)廳補(bǔ)卡”。隨后,吉林移動(dòng)10086官方微博回應(yīng)故障原因?yàn)橄到y(tǒng)繁忙,預(yù)計(jì)影響時(shí)間延長至2月7日16時(shí),公司維護(hù)人員正在緊急處理。當(dāng)晚,吉林移動(dòng)官方微信公眾號(hào)發(fā)布消息稱故障是由于城郊個(gè)別煙花燃放導(dǎo)致架空骨干光纜故障,影響部分用戶通信,現(xiàn)已完全恢復(fù)。
雖然,吉林移動(dòng)最終回復(fù)為通信光纜被鞭炮燃放所致,但很多業(yè)界專家認(rèn)為該回復(fù)經(jīng)不起推敲。吉林移動(dòng)規(guī)模網(wǎng)絡(luò)癱瘓的技術(shù)原因可能出現(xiàn)在哪里,值得思考。大部分業(yè)內(nèi)人士的分析認(rèn)為,基本可以判斷此次事件是由于核心網(wǎng)HSS(Home Subscriber Server,歸屬簽約用戶服務(wù)器)故障所致,并趕上春節(jié)假期,廠商相應(yīng)處理速度受影響,故而恢復(fù)較慢。
HSS功能與HLR類似,是IMS(IP Multimedia Subsystem,IP多媒體子系統(tǒng))中控制層的重要組成部分,負(fù)責(zé)移動(dòng)用戶管理的數(shù)據(jù)庫,能永久存儲(chǔ)和記錄所轄區(qū)域內(nèi)用戶的簽約數(shù)據(jù),并能夠動(dòng)態(tài)地更新用戶的位置信息,以便在呼叫業(yè)務(wù)中提供被呼叫用戶的網(wǎng)絡(luò)路由。
具體來說,HSS支持用于處理調(diào)用/會(huì)話的IMS網(wǎng)絡(luò)實(shí)體的主要用戶數(shù)據(jù)庫,包含用戶配置文件、執(zhí)行用戶的身份驗(yàn)證和授權(quán),并可提供有關(guān)用戶物理位置的信息。HSS所提供的功能包括IP多媒體功能、PS域必需的HLR功能及CS域必需的HLR功能,可處理的信息包括用戶識(shí)別、編號(hào)和地址信息;用戶安全信息,即針對(duì)鑒權(quán)和授權(quán)的網(wǎng)絡(luò)接入控制信息;用戶定位信息,即HSS支持用戶登記、存儲(chǔ)位置信息;用戶清單信息。
當(dāng)用戶選擇某個(gè)電信運(yùn)營商并購買了SIM卡之后,其相關(guān)信息就被錄入了HSS系統(tǒng)當(dāng)中,包括國際移動(dòng)用戶識(shí)別碼IMSI、移動(dòng)臺(tái)識(shí)別碼MSISDN、基本業(yè)務(wù)、補(bǔ)充業(yè)務(wù)簽約信息等。與拜訪位置寄存器VLR所不同,HSS中記錄了用戶所有的原始開戶信息,不會(huì)因?yàn)橛脩魪谋本┡艿搅松虾6鴮⑵涮?hào)碼和簽約信息進(jìn)行刪除。而每當(dāng)某用戶做被叫時(shí),主叫的MSCS會(huì)發(fā)送消息給HSS網(wǎng)元請求路由信息,HSS查找數(shù)據(jù)庫記錄,向被叫用戶當(dāng)前所在的MSCS/VLR請求一個(gè)漫游號(hào)碼,并將此號(hào)碼發(fā)送給主叫MSCS,主被叫MSCS之間通過該漫游號(hào)碼找到對(duì)方,并最終建立起主被叫用戶之間的通話。
可以看出,HSS在移動(dòng)通信網(wǎng)絡(luò)中的地位可謂舉足輕重,一旦HSS系統(tǒng)異常或者用戶簽約信息丟失,整個(gè)網(wǎng)絡(luò)必將陷入混亂不堪的狀態(tài)。
面對(duì)像春節(jié)這樣的大面積并發(fā)流量,從設(shè)備廠商的技術(shù)支撐以及運(yùn)營商技術(shù)角度看,目前運(yùn)營商以及設(shè)備商的支持能力需要提高。SA高級(jí)分析師楊光表示,吉林移動(dòng)系統(tǒng)故障的情況到現(xiàn)在都不具體。如果是軟件故障,可能和春節(jié)期間的人員流動(dòng)有關(guān)系,認(rèn)證鑒權(quán)量比較大,但是這種軟件的“bug”總讓人防不勝防。除了運(yùn)氣因素之外,只能說應(yīng)該加強(qiáng)軟件工程能力,提高軟件質(zhì)量控制的水平。不過也有可能是像光纖斷裂之類的硬件故障,但這類問題恢復(fù)時(shí)間較長,所以可能性較小,除非像在幾年前韓國運(yùn)營商出現(xiàn)過的整個(gè)機(jī)房失火狀況,處理起來相對(duì)麻煩。
不過,可以肯定的是,春節(jié)假期對(duì)廠商的響應(yīng)速度和故障處理有影響。運(yùn)營商和設(shè)備廠商對(duì)于此類事件都備有相應(yīng)的應(yīng)急預(yù)案,斷網(wǎng)事件發(fā)生后,運(yùn)營商和設(shè)備廠商們應(yīng)該對(duì)整個(gè)事件的處理過程做出檢討和分析,查看原來的預(yù)案是否有不合適和需要改進(jìn)的地方。以國際經(jīng)驗(yàn)來看,每一代新技術(shù)部署之后都有大規(guī)模網(wǎng)絡(luò)故障的案例,這是前進(jìn)中必然要付出的代價(jià)。在4G方面,中國啟動(dòng)較晚,產(chǎn)業(yè)鏈已經(jīng)比較成熟。而在5G方面,中國走得快,出現(xiàn)問題的幾率可能會(huì)更大一些。并且除了做好應(yīng)急預(yù)案之外,運(yùn)營商也應(yīng)該坦誠地與消費(fèi)者溝通,以求得用戶的理解。
業(yè)內(nèi)專家金峰則表示,未來運(yùn)營商應(yīng)該積極提高智能網(wǎng)絡(luò)方面的建設(shè)能力。主要方式為:一是智能化信息傳輸路由的選擇;二是智能化內(nèi)容本地存儲(chǔ)(智能CDN等);三是智能化的網(wǎng)絡(luò)優(yōu)先級(jí)保障,即依據(jù)數(shù)據(jù)類型等給予傳輸優(yōu)先級(jí)差異,只要不讓網(wǎng)絡(luò)崩潰,還是能保障用戶體驗(yàn)的。
當(dāng)然,設(shè)備本身是一方面,另一方面就是后續(xù)的運(yùn)維服務(wù),這個(gè)比較考驗(yàn)員工的能力,包括是否能發(fā)現(xiàn)問題,以及能否減少出錯(cuò)率。無獨(dú)有偶,在2017年9月,廣西移動(dòng)也出現(xiàn)了重大故障,當(dāng)時(shí)情況為80萬用戶手機(jī)失聯(lián),客戶服務(wù)中心共收到10086投訴2.0727萬起。經(jīng)過調(diào)查,故障原因竟為2017年9月7日后半夜,廠家人員進(jìn)行擴(kuò)容割接時(shí),工程師不小心把HSS設(shè)備的用戶數(shù)據(jù)給格式化刪除了,這也可以看出當(dāng)前火熱的AI對(duì)于運(yùn)營商智慧化基礎(chǔ)網(wǎng)絡(luò)管理的重要性。
同時(shí),此類事件也給電信運(yùn)營商的用戶發(fā)展戰(zhàn)略提供了思路。就單基站服務(wù)的用戶數(shù)來說,中國移動(dòng)差不多是中國電信和中國聯(lián)通的2倍,另外還有物聯(lián)網(wǎng)的用戶需要服務(wù)。此后,電信運(yùn)營商應(yīng)該審視一下現(xiàn)在供應(yīng)商管理的思路,怎么樣在成本和質(zhì)量之間找到更好的平衡點(diǎn)。
作為基礎(chǔ)網(wǎng)絡(luò)建設(shè)支撐者,運(yùn)營商的網(wǎng)絡(luò)故障是事故,引起了用戶吐槽,但是也可以從另一個(gè)角度看出運(yùn)營商的重要地位,一旦運(yùn)營商的“路”斷了,那這上面的微信、支付寶等“車”還怎么能跑起來?