交換機(jī)在網(wǎng)絡(luò)建設(shè)中使用得非常普遍。與此同時(shí)在日常工作中,交換機(jī)故障的現(xiàn)象是多樣的,故障的原因也是多樣的,本文將交換機(jī)分為硬件和軟件故障,并針對(duì)性地進(jìn)行分析,逐類(lèi)排除。
一、交換機(jī)故障分類(lèi):
交換機(jī)故障一般可以分為硬件故障和軟件故障兩大類(lèi)。硬件故障主要指交換機(jī)電源、背板、模塊、端口 等部件的故障,可以分為以下幾類(lèi)。
(1)電源故障:
由于外部供電不穩(wěn)定,或者電源線路老化、靜電或者雷擊等原因?qū)е码娫磽p壞或者風(fēng)扇停止,從而不能正常工作。由于電源緣故而導(dǎo)致機(jī)內(nèi)其他部件損壞的事情也經(jīng)常發(fā)生。
針對(duì)這類(lèi)故障,首先應(yīng)該做好外部電源的供應(yīng)工作,通過(guò)引入獨(dú)立的電力線來(lái)提供獨(dú)立的電源,并添加穩(wěn)壓器來(lái)避免瞬間高壓或低壓現(xiàn)象。一般來(lái)說(shuō),有兩路電供電,但由于各方面的原因,不可能為每臺(tái)交換機(jī)提供雙路供電,可以添加UPS(不間斷電源)來(lái)保證交換機(jī)的正常供電,最好使用提供穩(wěn)壓功能的UPS。另外還要在機(jī)房?jī)?nèi)設(shè)置專(zhuān)業(yè)的避雷措施,來(lái)避免雷電對(duì)交換機(jī)的傷害。
(2)端口故障:
這是最常見(jiàn)的硬件故障,無(wú)論是光纖端口還是雙絞線的RJ-45端口,在插拔接頭時(shí)一定要小心。如果不小心把光纖插頭弄臟,可能導(dǎo)致光纖端口污染而不能正常通信。我們經(jīng)常看到很多人喜歡帶電插拔接頭,理論上講是可以的,但是這樣也無(wú)意中增加了端口的故障發(fā)生率。在搬運(yùn)時(shí)不小心,也可能導(dǎo)致端口物理?yè)p壞。如果購(gòu)買(mǎi)的水晶頭尺寸偏大,插入交換機(jī)時(shí),也容易破壞端口。此外,如果接在端口上的雙絞線有一段暴露在室外,萬(wàn)一這根電纜被雷電擊中,就會(huì)導(dǎo)致所連交換機(jī)端口被擊壞,或者造成更加不可預(yù)料的損傷。
一般情況下,端口故障是某一個(gè)或者幾個(gè)端口損壞。所以,在排除了端口所連計(jì)算機(jī)的故障后,可以通過(guò)更換所連端口,來(lái)判斷其是否損壞。遇到此類(lèi)故障,可以在電源關(guān)閉后,用酒精棉球清洗端口。如果端口確實(shí)被損壞,那就只能更換端口了。
(3)模塊故障:
交換機(jī)是由很多模塊組成,比如:堆疊模塊、管理模塊(也叫控制模塊)、擴(kuò)展模塊等。這些模塊發(fā)生故障的機(jī)率很小,不過(guò)一旦出現(xiàn)問(wèn)題,就會(huì)遭受巨大的經(jīng)濟(jì)損失。如果插拔模塊時(shí)不小心,或者搬運(yùn)交換機(jī)時(shí)受到碰撞,或者電源不穩(wěn)定等情況,都可能導(dǎo)致此類(lèi)故障的發(fā)生。
當(dāng)然上面提到的這3個(gè)模塊都有外部接口,比較容易辨認(rèn),有的還可以通過(guò)模塊上的指示燈來(lái)辨別故障。比如:堆疊模塊上有一個(gè)扁平的梯形端口,或者有的交換機(jī)上是一個(gè)類(lèi)似于USB的接口。管理模塊上有一個(gè)CONSOLE口,用于和網(wǎng)管計(jì)算機(jī)建立連接,方便管理。如果擴(kuò)展模塊是光纖連接的話,會(huì)有一對(duì)光纖接口。
在排除此類(lèi)故障時(shí),首先確保交換機(jī)及模塊的電源正常供應(yīng),然后檢查各個(gè)模塊是否插在正確的位置上,最后檢查連接模塊的線纜是否正常。在連接管理模塊時(shí),還要考慮它是否采用規(guī)定的連接速率,是否有奇偶校驗(yàn),是否有數(shù)據(jù)流控制等因素。連接擴(kuò)展模塊時(shí),需要檢查是否匹配通信模式,比如:使用全雙工模式還是半雙工模式。當(dāng)然如果確認(rèn)模塊有故障,解決的方法只有一個(gè),那就是應(yīng)當(dāng)立即聯(lián)系供應(yīng)商給以更換。
(4)背板故障:
交換機(jī)的各個(gè)模塊都是接插在背板上的。如果環(huán)境潮濕,電路板受潮短路,或者元器件因高溫、雷擊等因素而受損都會(huì)造成電路板不能正常工作。比如:散熱性能不好或環(huán)境溫度太高導(dǎo)致機(jī)內(nèi)溫度升高,指使元器件燒壞。
在外部電源正常供電的情況下,如果交換機(jī)的各個(gè)內(nèi)部模塊都不能正常工作,那就可能是背板壞了,遇到這種情況惟一的辦法就是更換背板了。但硬件更新后,同一名稱(chēng)的電路板塊可能有多種不同的型號(hào)。本文由公眾號(hào)云極安整理,在一般情況下,新型號(hào)電路板的功能會(huì)兼容舊型號(hào)電路板的功能。但舊型號(hào)的電路板的功能,就不一定能兼容新型號(hào)電路板的功能了。
(5)線纜故障:
連接電纜和配線架的跳線是用來(lái)連接模塊、機(jī)架和設(shè)備用的。如果這些連接電纜內(nèi)的纜芯或跳線發(fā)生了短路、斷路或虛接,就會(huì)形成通信系統(tǒng)的故障。
從上面的幾種硬件故障來(lái)看,機(jī)房環(huán)境不佳極易導(dǎo)致各種硬件故障,所以醫(yī)院在建設(shè)機(jī)房時(shí),必須先做好防雷接地及供電電源、室內(nèi)溫度、室內(nèi)濕度、防電磁干擾、防靜電等環(huán)境的建設(shè),為網(wǎng)絡(luò)設(shè)備的正常工作提供良好的環(huán)境。
二、交換機(jī)的軟件故障:
交換機(jī)的軟件故障是指系統(tǒng)及其配置上的故障,它可以分為以下幾類(lèi)。
(1)系統(tǒng)錯(cuò)誤:
程序BUG:軟件程序設(shè)計(jì)存在著缺陷。交換機(jī)系統(tǒng)是硬件和軟件的結(jié)合體。在交換機(jī)內(nèi)部有一個(gè)可刷新的只讀存儲(chǔ)器,它保存的是這臺(tái)交換機(jī)所必需的軟件系統(tǒng)。由于當(dāng)時(shí)設(shè)計(jì)的原因,存在一些漏洞,在條件合適時(shí),會(huì)導(dǎo)致交換機(jī)滿載、丟包、錯(cuò)包等情況的發(fā)生。
對(duì)于此類(lèi)問(wèn)題,我們需要養(yǎng)成經(jīng)常瀏覽設(shè)備廠商網(wǎng)站的習(xí)慣,如果有新的系統(tǒng)推出或者新的補(bǔ)丁,請(qǐng)及時(shí)更新。
(2)配置不當(dāng):
由于各種交換機(jī)配置不一樣,網(wǎng)絡(luò)管理員往往在配置交換機(jī)時(shí)會(huì)出現(xiàn)配置錯(cuò)誤。主要錯(cuò)誤有:
1、系統(tǒng)數(shù)據(jù)錯(cuò)誤:系統(tǒng)數(shù)據(jù),包括軟件設(shè)置,用于對(duì)整個(gè)系統(tǒng)進(jìn)行定義。如系統(tǒng)數(shù)據(jù)出現(xiàn)錯(cuò)誤,也會(huì)造成系統(tǒng)全方位的故障,對(duì)整個(gè)交換局產(chǎn)生影響。
2、局?jǐn)?shù)據(jù)錯(cuò)誤:局?jǐn)?shù)據(jù)是根據(jù)交換局的具體情況而定義的。當(dāng)局?jǐn)?shù)據(jù)出現(xiàn)錯(cuò)誤時(shí),也會(huì)對(duì)整個(gè)交換局產(chǎn)生影響。
3、用戶數(shù)據(jù)錯(cuò)誤:用戶數(shù)據(jù)對(duì)每一個(gè)用戶的情況進(jìn)行定義,如果用戶數(shù)據(jù)被錯(cuò)誤設(shè)置,會(huì)對(duì)某個(gè)用戶產(chǎn)生影響。
4、硬件設(shè)置不合適:硬件設(shè)置是為減少電路板的種類(lèi),而在電路板上設(shè)置的一組或幾組開(kāi)關(guān),用以定義該電路板的工作狀態(tài)或在系統(tǒng)中所處位置,如硬件設(shè)置得不正確,必會(huì)導(dǎo)致該電路板工作不正常。
這類(lèi)故障有時(shí)很難發(fā)現(xiàn),需要一定的經(jīng)驗(yàn)積累。如果不能確定配置是否有問(wèn)題,請(qǐng)先恢復(fù)出廠默認(rèn)配置,然后再一步一步地配置。最好在配置之前,先閱讀說(shuō)明書(shū)。
(3)外部因素:
由于病毒或者黑客攻擊等情況的存在,有可能某臺(tái)主機(jī)向所連接的端口發(fā)送大量不符合封裝規(guī)則的數(shù)據(jù)包,造成交換機(jī)處理器過(guò)分繁忙,致使數(shù)據(jù)包來(lái)不及轉(zhuǎn)發(fā),進(jìn)而導(dǎo)致緩沖區(qū)溢出產(chǎn)生丟包現(xiàn)象。還有一種情況就是廣播風(fēng)暴,它不僅會(huì)占用大量的網(wǎng)絡(luò)帶寬,而且還將占用大量的CPU處理時(shí)間。本文由公眾號(hào)云極安整理,網(wǎng)絡(luò)如果長(zhǎng)時(shí)間被大量廣播數(shù)據(jù)包所占用,正常的點(diǎn)對(duì)通信就無(wú)法正常進(jìn)行,網(wǎng)絡(luò)速度就會(huì)變慢或者癱瘓。
總之,軟件故障應(yīng)該比硬件故障較難查找,解決問(wèn)題時(shí),可能不需要花費(fèi)過(guò)多的金錢(qián),而需要較多的時(shí)間。要網(wǎng)絡(luò)管理員在平時(shí)的工作中養(yǎng)成記錄日志的習(xí)慣。每當(dāng)發(fā)生故障時(shí),及時(shí)做好故障現(xiàn)象記錄、故障分析過(guò)程、故障解決方案、故障歸類(lèi)總結(jié)等工作,以積累自己的經(jīng)驗(yàn)。每解決一個(gè)問(wèn)題后都用心的去回顧問(wèn)題根源以及解決方法。這樣才能不斷的提高自己,更好的完成網(wǎng)絡(luò)管理的重任。