王禮坤
(海南核電有限公司 海南昌江)
隨著網絡的飛速發展,人們溝通交流、傳遞信息的方式越來越多。短信不再是現在人們溝通的主流方式。但是在核電站的通信中,短信依舊擁有不可替代的地位。快速、大量、有效地將信息傳遞給相關人員,而且不存在網絡安全問題。這正是核電站需要的特性。由于核電站的特殊性,建設一套安全、可靠、高效的應急短信平臺,在緊急情況下及時的將應急信息發送到相關人員手中是很有必要的。
通過前期對應急短信平臺的調研分析、現場的無線信號覆蓋情況以及應急短信平臺的建設方案評定。最終海南核電選用了中國電信的短信平臺。由專網、專線接入,實現短信群發、語音追呼、并及時反饋短信發送接收狀態,針對未發送成功者實行自動二次重發,以確保每一位人員都能正常的接收的短信。
海南核電采用短消息發送和追加語音呼叫的方式,以滿足昌江核電項目應急信息的發布需求。要求實現一套易于操作、可以擴展、便于接口的穩定高可用的應急短信平臺系統,并以應急待命人員可以完整無遺漏地接收并確保知悉應急信息指令為根本目的。應急短信平臺應該具備大批量信息群發的能力、高度的時效性和可靠性,以及不低于傳統無線尋呼系統的信息傳送速率和極低的誤碼率和信息丟失情況。實現將大批量的應急信息或語音信息及時、準確、可靠地發送給相關人員。為應急待命人員完成指令處理,爭取第一時間。海南核電應急短信平臺的設計需遵循以下原則。
穩定性:應急短信平臺必須保證高度的穩定性,其中包括硬件設備的穩定性及程序自身業務訪問的穩定性。
安全可靠性:提供良好的安全可靠性策略,支持多種安全可靠技術手段,包含必要的告警機制。
靈活性及可擴展性:系統管理、配置靈活方便并可實現靈活擴展,為未來業務發展奠定基礎。
可管理性:包括設備管理、配置管理、安全管理及QoS服務質量管理等。
先進性:采取較為先進、成熟的產品和技術以及軟件開發環境,確保系統具備一定先進性。
信息發送模式的多樣化,可以實現批量發送、單獨發送以及定制發送。具備語音追呼提示功能,在信息發送的同時,添加語音追呼可以實現語音呼叫提示,提示閱讀短信。語音本地化,可以自由錄制語音內容,并將語音內容發送給指定的人員。操作界面清晰明了,功能完善。系統信息發送狀態的實時查詢和反饋。專網、專線、2Mb數據鏈路直連行業網關實現與公網分離。
專線信令阻斷率低于0.1次/年。運營商短信中心業務并發處理能力應>100條/s,短信平臺實際信息發送率應>1條/s,時延<0.02 s。短信中心信息發送成功率>99.9%。設備故障修復及時率(4 h修復及時率)>90%。語音并發呼叫>30路,成功率>95%。平臺可用率100%。
應急短信系統主要由短信平臺和尋呼平臺2部分組成。
(1)短信平臺。短信平臺,要求能在短時間內完成大量應急短信的可靠發送等,運行各項業務應用系統等。因此網絡硬件系統建設應充分考慮到平臺所要求的性能、安全性、可靠性等方面的特征。
(2)尋呼平臺。尋呼平臺需要完成在短信發送出去后追加電話撥號,應急人員接通后,系統朗誦錄制的短信內容。為了實現自動語音呼叫功能,系統將建設一個小型的呼叫中心,實現自動語音提示功能。
在應急短信平臺項目中,主要設備有由運營商提供4臺服務器(2臺Web應用/網關/數據庫服務器,2臺語音服務器)、2臺防火墻;和由海南核電提供2臺堆疊交換機。上述設備,將共同構成基礎的短信平臺系統網絡。系統網絡構架見圖1。
(1)Web應用/網關/DB服務器。提供用戶和管理員Web操作界面,用于短信下發、統計查詢、辦公應用、用戶信息管理、后臺操作等相關功能。
安裝網關子系統,實現處理短信上下行,已發短信入庫,對接運營商網關等功能。安裝ORACLE等數據庫,提供主業務服務、歷史數據查詢、更新、事務管理、索引、高速緩存、查詢優化、安全及多用戶存取控制等。

圖1 網絡拓撲圖

圖2 軟件結構圖
2臺應用/網關/DB服務器實現1主1備。2臺服務器配置浮動地址,并通過“心跳監測”監控彼此的“負載調度器”服務,當其中一臺宕機時自動切換浮動地址至另外一臺服務器。整個系統的Web服務由“負載調度器”來調度運行。負載調度器的運行模型可見平臺軟件結構圖。通過網絡地址轉換,調度器重寫請求報文的目標地址,根據預設的調度算法,將請求分派給后端真實的服務器;真實的Web服務器的響應報文通過調度器時,報文源地址被重寫再返回給客戶,完成整個負載調度過程。“監控器”為“負載調度器”提供整個系統的監視服務,當其中一臺WEB服務器出現故障時,“監控器”將發送消息給“負載調度器”,自動屏蔽掉該服務器。
2臺服務器的數據庫表通過數據庫的快照互相同步。通過系統的數據規整模塊,可將分散在各服務器上的短信發送數據、狀態報告數據統一抽取到兩臺主數據庫中,以供各系統查詢統計。當系統出現故障時,導致的兩臺主數據庫數據不一致時,能夠自動校對同步數據;或當數據丟失時,能夠從服務器上的LOG日志中恢復數據。
(2)語音服務器。安裝Cute!Talk平臺軟件,完成外呼播放語音功能。每臺語音服務器上安裝一塊1E1(30路)語音卡用于語音外呼。每條E1分別接入海南電信不同的交換局。在網絡結構上采用雙平面網絡結構,每臺服務器均配置4端口千兆網卡,通過主備2根網線分別和核電廠BD中心機房的兩臺網絡交換機連接實現主備功能防止單點故障。
應急短信平臺的軟件架構如圖2。系統平臺在軟硬件上都有冗余。系統的高可用性可以通過檢測節點或服務進程故障和正確地重置系統來實現,使得系統收到的請求能被存活的結點處理。通過“監控器”來時刻監視各個服務器結點的健康狀況。當服務器對ICMP ping不可達時或者探測它的網絡服務在指定的時間沒有響應時,“監控器”通知“負載調度器”將該服務器從調度列表中刪除或者失效。這樣,新的服務請求就不會被調度到壞的結點。“監控器”能通過短信向管理員報告故障。一旦監測到服務器恢復工作,則通知調度器將其加入調度列表進行調度。另外,通過系統提供的管理程序,管理員可發命令隨時可以將新機器加入服務來提高系統的處理性能,也可以將已有的服務器切出服務,以便對服務器進行系統維護升級而不中斷服務。
應急短信平臺和海南核電網絡是通過防火墻進行網絡邊界隔離的,實際的管理、監控權限,為運營商管理,提供海南核電所需的IP地址接口。在用戶實際使用過程中,用戶所用的地址僅僅有2個,即短信服務地址和語音服務地址。在這種方式下,即可保障兩個網絡的互不干擾,又能保證用戶使用體驗不受影響。圖3展示了基本的使用場景。
在正常使用過程中,用戶處于海南核電辦公網絡環境,但辦公網絡環境若癱瘓,則短信平臺直接出現影響。所以,在短信平臺網絡內部,提供訪問終端,則十分必要。

圖3 網絡示意圖
設計中,另外提供了3個網絡終端,即EMSMC-EM-01、EMSMC-L710-01、EMSMC-L720-01,分別放置于 EM 樓、1號主控、2號主控。三臺終端不受海南核電網絡狀況影響,并可通過虛擬桌面訪問海南核電現有應用,通過web訪問部分授權應用。圖4為最后效果圖。
應急短信平臺系統的主要功能點有:短信中心、網關接口、通信錄、語音呼叫模塊、系統管理、網關檢測預警、平臺日志管理、數據規整模塊以及負載調度功能(圖5)。

圖4 網絡效果示意圖

圖5 功能結構示意圖
(1)短信中心。短信中心主要提供的業務功能包括:短信預設定義、短信發送,短信接收,查詢統計。設計人性化,可以從通信錄里面選擇多個聯系人或者群發組作為短信的接收者,當輸入短信時,提示字符個數和短信條數。為短信的編制和發送提供便利。
(2)網關接口。包含上行接口與下行接口。支持多連接、多進程并發處理。
中國移動CMPP協議,完全支持中國移動所制定的《中國移動通信互聯網短信平臺接口協議》3.0版本(簡稱CMPP協議)。
中國聯通SGIP協議,支持由中國聯通所制定的《中國聯合通信公司短消息網關系統接口協議》(簡稱SGIP協議)版本1.2及其適應性修改版本(支持LinkID)。
中國電信SMGP協議,支持由中國電信所制定的《基于固定電話網的信息終端及綜合信息系統技術規范》中《第七分冊短消息網關(SMGP)協議V2.0》及《第七分冊 短消息網關(SMGP)協議V1.3》
(3)通信錄。通信錄采用目錄樹結構管理,直觀、使用方便。通過核心字段的管理,能更好的對通信錄進行管理。
(4)語音呼叫系統。語音呼叫系統:用戶在啟動應急短信發送時,同時觸發語音追呼功能,實現語音呼叫提醒,提示閱讀短信內容。
(5)系統管理功能。后臺管理系統主要實現對系統的后臺管理。包括通道管理、組織管理、用戶管理和日志管理。
(6)檢測預警模塊。網關檢測預警模塊主要監測系統運行期間,系統硬件或軟件引發的系統故障,系統不斷的監測并將出現的異常告警信息提示給管理人員。主要包含。
應用日志告警,監控應用服務程序的運用情況,當出現異常情況時,生成日志,并告警。
操作系統/數據庫檢測自動告警,監測系統文件,系統硬盤使用空間、數據庫、磁盤等異常告警。
主機服務器SNMP包監控告警,監測網絡連接等,異常告警。
(7)平臺日志管理。網關連接日志。用于管理短信平臺與3大運營商短信網關的網絡連接監控日志;短信發送/接收日志。用于管理短信平臺發送/接收的監控日志;服務程序運行日志。用于管理短信平臺服務程序運行的監控日志。
(8)數據歸整模塊。將分散在各短信發送服務器上的短信發送數據、狀態報告數據統一抽取到兩臺主數據庫中,以供各IT系統查詢。當系統出現故障時,導致的兩臺主數據庫數據不一致時,能夠自動校對同步數據;或當數據丟失時,能夠從短信服務器上的LOG日志中恢復數據。
(9)負載調度管理。負載調度模塊,通過網絡地址轉換,調度器重寫接口請求報文的目標地址,根據預設的調度算法,將請求分派給后端真實的短信服務器;真實的短信服務器的響應報文通過調度器時,報文源地址被重寫再返回給客戶,完成整個負載調度過程。
監控預警模塊,通過“監控器”來時刻監視各個服務器結點的健康狀況。當服務器出現故障時,“監控器”通知“負載調度器”將該服務器從調度列表中刪除或者失效。一旦監測到服務器恢復工作,則通知調度器將其加入調度列表進行調度。
雙機切換模塊,當檢測到“負載調度器”出現ICMP ping不可達時或者探測它的網絡服務在指定的時間沒有響應時,部署在兩臺Web服務器上的“雙機切換模塊”能夠應用自動切換服務器。或系統需要維護更新時,也可通過“雙機切換模塊”進行手工切換服務器。
本項目從用戶需求到方案設計,再到項目實施,受到各種因素的制約,導致整個項目推進的有點緩慢,總體進度有些滯后。但同時也在這過程中不斷的發現問題和解決問題,才能使平臺最終達到目前的效果,滿足用戶需求。通過對最原始的用戶需求到最終的項目實施進行梳理,總結整個項目實施過程的經驗。為今后相關項目建設提出良好建議,有效地將項目實施過程中的經驗傳承下去。