大部分交換機(jī)都會(huì)有自我診斷的功能
當(dāng)交換機(jī)或者交換機(jī)端口由于某些原因出現(xiàn)故障的時(shí)候,都會(huì)通過指示燈來(lái)告知管理員存在的錯(cuò)誤。不過有些時(shí)候交換機(jī)也會(huì)存在誤診斷的情況。如交換機(jī)的端口工作指示燈明明表示正常,但是用戶卻反映網(wǎng)絡(luò)不通。如果只是普通的用戶,問題還不是很大。但是如果這個(gè)端口恰巧是用來(lái)進(jìn)行備份的,那么情況就會(huì)比較糟。為了避免這種情況,在實(shí)際工作中很多網(wǎng)絡(luò)管理員都喜歡采用交換機(jī)的UDLD模式來(lái)消除交換機(jī)的這種誤診斷。
一、什么情況下會(huì)出現(xiàn)誤診斷?
誤診斷的情形主要是即使當(dāng)鏈路或者交換機(jī)的端口指示燈正常的(即端口的狀態(tài)是UP的),但是接口仍然無(wú)法正常傳遞數(shù)據(jù)流量。通常情況才將這種錯(cuò)誤稱之為單向鏈路。一般情況下,當(dāng)出現(xiàn)接口故障、軟件故障、硬件失效或者其他異常原因的時(shí)候,就會(huì)出現(xiàn)這種錯(cuò)誤。憑現(xiàn)在的技術(shù)手段,交換機(jī)還不能夠從根本上避免這種錯(cuò)誤的發(fā)生。為此只有采取其他的方式,加強(qiáng)對(duì)交換機(jī)端口的檢測(cè),以盡早發(fā)現(xiàn)這種錯(cuò)誤。在思科系列的交換機(jī)上,就采用了UDLD模式來(lái)解決這種情況下的誤診斷。
UDLD從理論上來(lái)說(shuō),其是在第二層工作的協(xié)議。不過從實(shí)際情況來(lái)看,其往往跟第一層的內(nèi)容有很深的關(guān)系。也就是說(shuō),UDLD模式不光光在第二層運(yùn)作,其還會(huì)跟第一層的相關(guān)機(jī)制協(xié)同工作,才能夠完成。其主要的思路就是UDLD協(xié)議運(yùn)行在第一、二層之間,最終確定鏈路的實(shí)際工作狀態(tài)。當(dāng)發(fā)現(xiàn)有“鏈路UP狀態(tài)正常,但是沒有傳遞流量”的時(shí)候,UDLD協(xié)議會(huì)馬上報(bào)警。
具體的說(shuō),在第一層中通過自動(dòng)協(xié)商功能來(lái)觀測(cè)物理信令等相關(guān)的參數(shù)運(yùn)作。而UDLD協(xié)議則會(huì)完成一些自動(dòng)協(xié)商機(jī)制不能夠執(zhí)行的任務(wù)。讓自動(dòng)協(xié)商發(fā)現(xiàn)物理信令有異常的時(shí)候,不會(huì)自動(dòng)將端口從UP狀態(tài)轉(zhuǎn)換為其他狀態(tài),從而導(dǎo)致了單向鏈路的故障。而UDLD協(xié)議能夠接受來(lái)自自動(dòng)協(xié)商機(jī)制傳遞來(lái)的參數(shù),然后再發(fā)現(xiàn)故障的時(shí)候及時(shí)的將交換機(jī)端口處于關(guān)閉狀態(tài)。可見,UDLD模式所采用的不只只是一種協(xié)議,而是UDLD協(xié)議與自動(dòng)協(xié)商機(jī)制相互作用的結(jié)果。如果網(wǎng)絡(luò)管理員要啟動(dòng)UDLD模式的話,那么就必須要同時(shí)啟用UDLD協(xié)議和自動(dòng)協(xié)商機(jī)制,在第一層與第二層中通過他們的各司其責(zé)、協(xié)同工作,來(lái)防止物理上或者邏輯上的單向連接,從而從根本上消除交換機(jī)的誤診斷。
網(wǎng)絡(luò)管理員需要明白的是,UDLD并不是交換機(jī)原有診斷體系的補(bǔ)充,而是一種獨(dú)立的診斷方法。也就是說(shuō),它是從另一個(gè)角度對(duì)交換機(jī)各個(gè)端口的運(yùn)行狀態(tài)進(jìn)行自我診斷。兩者之間基本上沒有沖突或者重疊的地方。在實(shí)際工作中,傳統(tǒng)的診斷方法與UDLD模式經(jīng)常是同時(shí)使用。
二、合理配置UDLD模式下的各種參數(shù)
如果同時(shí)啟用了UDLD協(xié)議與自動(dòng)協(xié)商機(jī)制,就啟動(dòng)了UDLD模式,在這種情況下,交換機(jī)的某個(gè)接口會(huì)定期的向鄰近的端口發(fā)送UDLD協(xié)議數(shù)據(jù)報(bào)。在正常情況下,交換機(jī)的這個(gè)接口會(huì)在預(yù)定計(jì)時(shí)器到期之前接收到回應(yīng)的數(shù)據(jù)包。如果在這個(gè)計(jì)時(shí)器到期之前,交換機(jī)發(fā)送UDLD數(shù)據(jù)包的接口還沒有收到回應(yīng)信息,則UDLD協(xié)議就會(huì)認(rèn)為出現(xiàn)了故障,即發(fā)生了單向鏈路的故障(其實(shí)更加精確的說(shuō),應(yīng)該是自動(dòng)協(xié)商發(fā)現(xiàn)了這個(gè)故障并告知了UDLD協(xié)議)。當(dāng)UDLD知道這種情況后,會(huì)馬上關(guān)閉有問題的交換機(jī)接口。
在UDLD配置的時(shí)候,首先需要考慮這個(gè)計(jì)時(shí)器。也就是說(shuō),將這個(gè)時(shí)間設(shè)置為多少為好。如果時(shí)間設(shè)置的比較短,不僅會(huì)造成不必要的數(shù)據(jù)流量,而且也有可能因?yàn)閿?shù)據(jù)延遲等原因?qū)е聼o(wú)法在合理的時(shí)間內(nèi)接到回應(yīng)的數(shù)據(jù)包。而如果將這個(gè)計(jì)時(shí)器的時(shí)間設(shè)置的比較長(zhǎng)的話,那么就可能無(wú)法在短時(shí)間內(nèi)發(fā)現(xiàn)問題。要知道,可能一分鐘對(duì)于用戶來(lái)說(shuō),沒有多少感覺。但是對(duì)于數(shù)據(jù)網(wǎng)絡(luò)傳輸來(lái)說(shuō),這個(gè)時(shí)間就很長(zhǎng)了。默認(rèn)情況下,這個(gè)計(jì)時(shí)器是15秒。
在實(shí)際工作中,網(wǎng)絡(luò)管理員可能需要根據(jù)不同的情況來(lái)合理設(shè)置這個(gè)參數(shù)。如需要根據(jù)企業(yè)網(wǎng)絡(luò)的復(fù)雜情況、布線的長(zhǎng)短來(lái)考慮。如根據(jù)以前的情況,企業(yè)可能經(jīng)常會(huì)遇到網(wǎng)絡(luò)堵塞等情況,而這種堵塞也是暫時(shí)的,那么要適當(dāng)延長(zhǎng)這個(gè)計(jì)時(shí)器等等。筆者的建議是在剛開始的時(shí)候可以將這個(gè)計(jì)時(shí)器設(shè)置的長(zhǎng)一點(diǎn),然后慢慢的減短。最后得到一個(gè)合理的數(shù)值。
|