鄭州洪災(zāi),通信網(wǎng)絡(luò)的容災(zāi)機制,發(fā)揮作用了嗎?
作者:
子言
發(fā)布時間:
2021-07-23
這兩天,河南鄭州等地區(qū)遭受罕見的強降雨襲擊,出現(xiàn)了嚴(yán)重的洪澇災(zāi)害。
洪水造成的城市內(nèi)澇,給當(dāng)?shù)鼐用竦纳敭a(chǎn)帶來重大損失。來自現(xiàn)場的觸目驚心的視頻畫面,牽動著全國人民的心。
目前,一線正在進行緊張的搶險救災(zāi)行動。我們只能默默祈禱,希望雨早點停,水早點退,災(zāi)區(qū)的損失不要進一步擴大,災(zāi)區(qū)人民的生活能盡快恢復(fù)正常。
作為通信人,小棗君在關(guān)注現(xiàn)場災(zāi)情的同時,特別留意了一下通信網(wǎng)絡(luò)設(shè)施的損失情況。
根據(jù)以往的經(jīng)驗,遇到大災(zāi)大害,當(dāng)?shù)氐耐ㄐ呕A(chǔ)設(shè)施一定會遭受損壞。而可靠的通信網(wǎng)絡(luò),是搶險救災(zāi)的重要保障,也是穩(wěn)定一線災(zāi)民情緒的基石。
也就是說,災(zāi)害一旦發(fā)生,一線通信人必須盡快投入到通信設(shè)備搶修和應(yīng)急保障的工作中。
小棗君的朋友圈里,就已經(jīng)有河南的通信同行正在加班加點搶修,力求盡快恢復(fù)業(yè)務(wù)。
圖片來自鄭州聯(lián)通
根據(jù)現(xiàn)場同行反饋的故障通知消息來看,這次洪災(zāi)確實造成了遠超以往的危害。
鄭州現(xiàn)場的故障通知消息
往常的普通洪災(zāi),一般只會淹沒基站和接入機房。更嚴(yán)重一點,也就是各區(qū)縣的匯聚機房和機樓機房。這次特大降雨造成的內(nèi)澇,竟然將省會城市部分骨干核心機房也淹了,而且主備機房都發(fā)生雨水倒灌。
這種情況,極為罕見。近幾十年,國內(nèi)應(yīng)該是沒有發(fā)生過。
骨干機房,運行著重要的核心網(wǎng)設(shè)備。而核心網(wǎng)設(shè)備,是整個通信網(wǎng)絡(luò)的心臟。
核心網(wǎng)機房
目前來看,受影響最大的,是運營商的HLR設(shè)備。
HLR,全名是Home Location Register,歸屬位置寄存器。它是一種用戶數(shù)據(jù)庫設(shè)備,是核心網(wǎng)關(guān)鍵設(shè)備之一,存儲著所有本地用戶的數(shù)據(jù)信息,包括用戶的基本信息、基本業(yè)務(wù)信息、補充業(yè)務(wù)信息,等等。
HLR是2G/3G時代的叫法,現(xiàn)在4G/5G時代,HLR已經(jīng)改名叫HSS(Home Subscriber Server,歸屬簽約用戶服務(wù)器),功能和性能上有所升級。
HLR和HSS,作為用戶數(shù)據(jù)庫,是整個通信網(wǎng)絡(luò)的核心。但凡出現(xiàn)重大網(wǎng)絡(luò)故障,多半和它們有關(guān)。要么是數(shù)據(jù)庫誤刪,要么是傳輸中斷(例如光纖中斷),導(dǎo)致HLR(HSS)鏈路中斷。
2017年廣西南寧重大網(wǎng)絡(luò)中斷故障,就是運營商HLR的80萬用戶數(shù)據(jù)被誤刪導(dǎo)致的。當(dāng)時整網(wǎng)業(yè)務(wù)中斷長達8小時39分,影響巨大,責(zé)任方被罰5億元人民幣。
這次鄭州HLR被淹退服(通信行業(yè)術(shù)語:退出服務(wù)),影響本來也是巨大的。但是從現(xiàn)場情況來看,應(yīng)該是容災(zāi)機制發(fā)揮了作用,所以沒有造成大面積的通信中斷。
首先,提醒一下河南災(zāi)區(qū)的兄弟姐妹們,最近期間手機盡量不要關(guān)機。因為手機開關(guān)機都需要聯(lián)系HLR進行“登記”。
在HLR退服的情況下,手機開機,信令消息到不了HLR,就無法得到來自網(wǎng)絡(luò)的身份確認(rèn),也就無法接入網(wǎng)絡(luò)。
HLR退服情況下
一般來說,手機連入網(wǎng)絡(luò)后,網(wǎng)絡(luò)也會定期對手機進行“位置更新”。也就是說,每隔一段時間,網(wǎng)絡(luò)會讓手機上報狀態(tài)信息。這次,在災(zāi)情發(fā)生的情況下,當(dāng)?shù)剡\營商可能已經(jīng)在網(wǎng)絡(luò)側(cè)手動修改配置,延長了更新周期,避免位置更新失敗。
此外,本次鄭州HLR退服,運營商的異城異地備份方案也發(fā)揮了重要作用。
在本地主備HLR都受災(zāi)的情況下,運營商啟用了位于鄰近省份省會城市的備份HLR,臨時頂替退服的本地HLR,保障業(yè)務(wù)的實現(xiàn)。
這基本上算是最高級別的備份了,專門針對戰(zhàn)爭、恐襲、地震等極端情況。
在極特殊的情況下,用戶通話量激增,網(wǎng)絡(luò)中信令消息太多,超過了網(wǎng)絡(luò)鏈路的負(fù)荷,網(wǎng)絡(luò)側(cè)可能會采取取消用戶鑒權(quán)等手段,盡可能降低網(wǎng)絡(luò)信令負(fù)荷,避免網(wǎng)絡(luò)徹底擁塞。
本次洪災(zāi),固網(wǎng)寬帶接入業(yè)務(wù)的radius設(shè)備離線,就采取了取消鑒權(quán)的方法。
Radius,全名是Remote Authentication Dial In User Service,遠程用戶撥號認(rèn)證系統(tǒng)??疵志椭?,也是一個對用戶進行認(rèn)證授權(quán)的設(shè)備?,F(xiàn)場radius故障,采用的解決方案,就是直接關(guān)閉認(rèn)證,啟用撥號不認(rèn)證策略,保證所有用戶網(wǎng)絡(luò)暢通。
除了HLR之外,根據(jù)現(xiàn)場反饋的情況,微波中繼線路也有短暫影響,IPTV業(yè)務(wù)也受影響,這些都不算太麻煩。
目前,現(xiàn)場的通信工程師們正在進行緊張的設(shè)備搶修,相信不久之后,核心骨干網(wǎng)絡(luò)的功能就會恢復(fù)。隨著洪水的退卻,各個站點機房的搶修也會緊鑼密鼓地啟動起來,老百姓的手機和寬帶業(yè)務(wù),會逐漸恢復(fù)正常。
最后,再次祈禱河南地區(qū)的雨早點停,洪水早點退,希望大家都平平安安的,也希望所有一線的通信工程師們能注意安全,不辱使命,搶險成功!
圖片來自網(wǎng)絡(luò),非鄭州災(zāi)區(qū)現(xiàn)場
相關(guān)新聞
快捷導(dǎo)航
關(guān)注我們
掃一掃,關(guān)注我們公眾號