網管心得:揪出堵塞(sāi)網絡通信的(de)禍首實錄
上網速度緩慢、數據嚴重丟包故障現象十分(fèn)常(cháng)見,造成該故障的原因也是十分繁多,這種類型的網絡故障排查解決起來(lái)自然也比較麻煩;為了幫助大(dà)家多積累這方麵的排查經驗,本文(wén)現在就從實戰(zhàn)角度出發,來向大家貢獻一則由(yóu)網絡線(xiàn)纜連接不當引發的網絡通道堵塞故障的排(pái)查過程,希望這些(xiē)內容能讓大家得到啟發!
故障現象(xiàng)
筆者所(suǒ)在單(dān)位的(de)局域網是由一個中心機房的工作子網和各個樓層的工作子網組成,中心機房的工作子(zǐ)網(wǎng)中有包括Web服務器在內的各個應用(yòng)係(xì)統服務器以及核心路由交換機,各個樓層的工作子網全部通(tōng)過千兆光纖線路與中心機房的(de)核心交換機保持連(lián)接,局域(yù)網中的所有終端電腦全部通過超5類雙絞(jiǎo)線實現與各個樓(lóu)層交換機的百兆網絡互聯。為了抑製廣播風(fēng)暴現象以及網絡病毒的瘋狂傳播,網絡管理員(yuán)采用VLAN技術將整個局域網劃分成了不同的虛(xū)擬工作子網,所(suǒ)有(yǒu)虛擬工作子網全部通過中心機房的核心路(lù)由交換機實現不同虛擬工作子網之間的(de)路由。
平時,整個局域網中的所有終(zhōng)端電腦都能正常(cháng)上網,並且上網速度也非常理想。可是,最近這幾天,網絡管理員不斷接到來自五樓不(bú)同用戶(hù)的電話報修(xiū)故障(zhàng),聲稱它們的終端(duān)電腦上網訪問速度突然變慢,從網上下載信(xìn)息時一點也(yě)沒有以往一氣嗬成的感(gǎn)覺了,現在的下載速度(dù)就象(xiàng)蝸牛一樣爬行,經常要訪問的站點也打不開了,電子(zǐ)郵件也不能正常收發了。接到故(gù)障求援之後,網絡管理員立(lì)即從自己的終端電腦出發,使用ping命令測(cè)試五樓樓層接入交換機的IP地址,結果發現這項測試操作(zuò)延遲現象十分(fèn)嚴重(chóng),而且數據丟包率達到了驚人的16%左右,這在一個規模不大的(de)局域網網絡(luò)中來說是不(bú)應該(gāi)的。既然故(gù)障現象發生了,網絡管理員立即采取措施,進行了以下排查操作。
故障排查
考慮到最近一段時間,整個局域(yù)網(wǎng)網(wǎng)絡曾經發生過網(wǎng)絡病毒瘋狂肆虐的現象,為此網絡(luò)管理員首先將故障排(pái)查對象鎖定在網絡病毒身(shēn)上(shàng);因為一(yī)旦局域網中真的(de)存在許多網絡病毒,並且這些病毒同時爆發的(de)話(huà),那麽(me)對應網絡中(zhōng)的有限出口(kǒu)帶寬資源可能會被大量占用,那麽(me)終端電腦上網速度(dù)自然會受到明(míng)顯影響。為了判斷網絡病毒是否是上(shàng)述故障現象的禍首,網絡管理員立即(jí)趕到五樓(lóu)樓層交換機現場,將自己隨身攜帶的筆記本電腦通過Console控(kòng)製線(xiàn)纜連接到該樓(lóu)層交換機上,然(rán)後在筆記本電腦中運行Sniff程序進行數據抓(zhuā)包分析;結果網絡管理員發現,這個樓層的虛擬工作子網內當前上線(xiàn)的終端電腦數量隻有二三十台(tái),而對應工作子網內的數據包流量也(yě)不是(shì)很大;在這(zhè)種情形下,網絡管理員嚐試(shì)通過該樓層的交換機進(jìn)行上網訪問(wèn)時,發現網頁(yè)內容(róng)仍然無法訪問,電子(zǐ)郵件收發也無法進行(háng),看來造成這(zhè)種故障現(xiàn)象的因素不是網絡病毒。
在排除網(wǎng)絡病毒因素後,網絡管理員又對這個樓層(céng)的(de)交換機設備進行了仔細觀察,發現連接到該交換機的終端(duān)電腦(nǎo)數量比較多,而且對應交換機的型(xíng)號屬於低端產品,它的自身運(yùn)行性能(néng)也是一般。正常情況下,這種低端的樓層交(jiāo)換機(jī)持續運(yùn)行的時間比較長(zhǎng)的話,很有可能出現係統緩存溢出(chū)錯誤等,或者交換機內部的性能元件發(fā)生老化現(xiàn)象,這些現象都會影(yǐng)響交換機的運行穩定性。對(duì)於這樣的“軟”故障現象,往往都能通(tōng)過重新啟動的方法來解決,依照這樣的思路,網絡管理員立即重新啟動(dòng)了一下五樓樓層交換(huàn)機係統,沒有多長時(shí)間,該交換機就啟動穩定了(le)。原以為這次努力能夠解決問題,可(kě)是當網絡管理員再次從自己(jǐ)的筆記本(běn)電腦(nǎo)中訪問(wèn)目標站(zhàn)點頁麵中的內容時,發現網絡訪問速度仍然非(fēi)常緩慢,顯然網絡通道仍然處於堵塞(sāi)狀態。
既然故(gù)障現象與網絡(luò)病毒以及樓層交換機自身(shēn)運行狀態沒有關係,那麽(me)究竟是什麽(me)因素造成了這種故(gù)障現象呢(ne)?經過仔細思索,網絡管理員突然聯(lián)想到了網絡(luò)環路(lù)因素,因為(wéi)局域網中(zhōng)一(yī)旦存在網絡(luò)環路現象的話(huà),同(tóng)樣能夠產生廣播風暴現象,從而可能會堵塞網絡傳輸通道,那麽局域網中究竟存在不存在網絡環路現象呢?正常(cháng)情況下,如果五(wǔ)樓工作子網中存(cún)在網絡環路現象的話,那麽對(duì)應樓層(céng)的(de)交換機上的所(suǒ)有信號燈狀態都應(yīng)該處於不停閃爍狀態。基於這樣的分析,網絡管理員立即對樓層交換機控製麵板上(shàng)的信(xìn)號燈狀態進行了觀察,結果(guǒ)發現這些交換端(duān)口信(xìn)號燈果然存在閃爍過於頻繁的嫌(xián)疑;於是,網絡管(guǎn)理員立即斷(duàn)開樓層交換機與對應樓(lóu)層(céng)的光(guāng)纖(xiān)收發器之(zhī)間(jiān)的連接線路,通過普通的網絡線纜將自己的筆記本電腦連接到對應樓層的光纖(xiān)收發器網絡端口上,滿以為這次可能(néng)能夠解決問題,可是網絡管理員再次在筆記(jì)本電腦中訪問目(mù)標站點頁麵時,網頁內容竟然還是(shì)無(wú)法打開,之前出現的故(gù)障現象仍然存在,很明顯這樣的故障現象與樓層交換機沒有任(rèn)何關係!
在確認上麵的故障現象與樓(lóu)層(céng)交換機沒有任(rèn)何關係之後,網絡管理員又將故障排查的範圍縮(suō)小到光纖連(lián)接跳線、光(guāng)收發器、中心機房的核心交換(huàn)機(jī)上了,因為隻有這些位置的設備或線纜沒有檢查(chá)了。由於除了五樓之外的其他樓層交換機同樣也是連接到中心機房的核心交(jiāo)換機上的(de),仔細觀察其他樓層用戶的(de)上網狀態時,發現它們都是正常的,所以(yǐ)從這一點來看,網絡管理員估計中心機房(fáng)的核心交換機自身工作狀態是正常的。那有沒有可能是連接五樓樓層交換(huàn)機的核心交換機端口存在問題,導致五樓用戶不(bú)能正常(cháng)通(tōng)過核心交換機訪問網絡呢?聯想到這一點,網絡管理員立即以係統管理員權限登錄進入核心交換(huàn)機後台,進入(rù)連接五樓的交換端口視圖(tú)配置界麵,使用(yòng)“display interface”命令查看(kàn)該交換端口的狀態信息(xī)時,沒有發現有什麽異常現象,同時該交換端口的工作狀(zhuàng)態也處於“up”狀態。後來,網絡管理員(yuán)擔心連接五樓交換(huàn)機的(de)光纖(xiān)收發器(qì)以及光纖跳線接頭存在問題,於(yú)是又不厭其煩地采用手工方法對光纖連接(jiē)跳線線(xiàn)頭進行了衛生清潔工作,同時又替換了光纖收(shōu)發(fā)器設備(bèi),可即(jí)使這(zhè)樣努力,故障排查工作還是一點(diǎn)沒有進展。
故障解決
在萬般無奈之下,網絡管理員隻好趕到中心機房,來到核心交換機現場(chǎng),仔細觀察核心交換機的物(wù)理(lǐ)連接時,終於弄清楚了故障產生的根源(yuán)。我們(men)知道,普通的光纖收發器設備通常(cháng)隻有一對光口以及一個普通的以太(tài)網端口,其中光口是專門用來連接光纖跳線的(de),以太(tài)網端口可以連接終端電腦進行網絡訪問測試;可是,中心機房使用的光纖收發器設備卻與眾不同,它同時(shí)擁有(yǒu)兩個普通的以太網端口,它的作(zuò)用與一隻包含兩個交換端口的(de)微型交換機相當(dāng)。正常情況下,我(wǒ)們隻會同時用到一個以太網端口和連接光(guāng)纖跳線的光口,另外一個以(yǐ)太網端口平時不怎麽用到;可是網(wǎng)絡(luò)管理員在(zài)這裏卻(què)看到,連(lián)接核心路由交換機的光纖收發(fā)器,同時使用了兩個普(pǔ)通的以太網端口,分別沿著這兩個以太網端口的連接線纜進行查詢時,網絡管理員發現它們竟然同時連接到核心交換機設備上了,隻是它們連接到核心交換機不同的Vlan接口上罷了。由於各個樓層的Vlan全部設置在核(hé)心路由交換機上,各個樓層Vlan相互之間的訪問路由也配置在該(gāi)設備上,當連接五樓的光纖收發器上的兩個普通以太網端口同時連(lián)接(jiē)到(dào)核心路由交換機上時,對應光纖收發器與(yǔ)核心路由交換機之間無形之中就形成(chéng)了網絡環路現象,結果造成對應光纖收發器的連(lián)接端口被大量的(de)數據包堵塞,從而(ér)影響了五樓用戶的上網訪(fǎng)問速度。
找到(dào)了故障產生的“罪槐禍(huò)首”後,網絡(luò)管理員立即(jí)從連接五樓(lóu)的光纖收發器上拔下了多餘(yú)的網絡連接線纜,再次使用筆記本電腦(nǎo)從五樓網段進(jìn)行目標網站的訪問時,發現(xiàn)網絡訪問(wèn)速(sù)度已經恢複到正常狀(zhuàng)態,同時發現收發電子(zǐ)郵件等操作也恢複了正常,這說明五樓的網絡(luò)故障現象已經徹底消失了。
原(yuán)因探究
上麵的故障現象雖(suī)然已經被成功解(jiě)決了(le),但是(shì)讓網絡管(guǎn)理(lǐ)員感到疑惑不解的是,為什麽光(guāng)纖(xiān)收發器上的兩個(gè)普(pǔ)通以太網接口會同時連接有網絡線纜?網絡管理員經過仔細觀察看到。在(zài)中心機房的(de)接線(xiàn)櫃內同時安裝了來自其他樓層的十幾個光纖收發器設備,其中某個光纖收發器設備由於(yú)發生了硬件(jiàn)質量問題(tí)被暫時從接(jiē)線櫃內移走(zǒu)了,不過對應設備的電(diàn)源連接線纜以及(jí)網絡連接線纜仍然還放置在接線櫃內(nèi);網絡管理員詢問中心機房的其他工(gōng)作人員時得知,前幾(jǐ)天另外一個工作(zuò)人員在對大樓網絡設備正常巡檢時,看來保留下來的網絡線纜時,以為是該網絡線纜由於接觸不牢靠從設備(bèi)上滑落(luò)下來了,於(yú)是下意識地將它連接到(dào)來自五樓的光纖收發器設備上(shàng)了,這樣一則奇怪(guài)的網絡故障現象就在不經意間發生了。
從這則故障的產生過程來看,筆者認為平時遭(zāo)遇到的許多網絡故障現象,都是(shì)由於網(wǎng)絡(luò)管理員自己在工(gōng)作過程中(zhōng)粗心大意引起的。所以,為了保證局域網網絡能夠始終穩定(dìng)地運行(háng),我們除了在安裝、組建的時候,要嚴格遵守網絡(luò)布線標準外,還需要(yào)在平時加強對網絡工(gōng)作環境的維護,千萬不(bú)能圖一時的操作便利而(ér)輕易留下故障隱患。
關鍵詞:網管心得,網(wǎng)絡通信
閱讀本文後您有(yǒu)什麽感想? 已有 人給出評(píng)價!
- 0
- 0
- 0
- 0
- 0
- 0