Cisco認(rèn)證:閑談網(wǎng)絡(luò)運(yùn)維管理的那些事兒之三

字號(hào):

網(wǎng)絡(luò)平臺(tái)的組成有很多的東西,其最本質(zhì)的核心是直接對(duì)業(yè)務(wù)的保障。舉例來(lái)說(shuō),我們的IT管理人員始終關(guān)注的是什么呢?應(yīng)用系統(tǒng)在上面走的好不好,我們是為業(yè)務(wù)系統(tǒng)提供支撐的,我們必須關(guān)注業(yè)務(wù)系統(tǒng)的好壞,業(yè)務(wù)系統(tǒng)怎么關(guān)注呢?很多人有個(gè)誤區(qū),認(rèn)為關(guān)注服務(wù)器的狀態(tài)就等于關(guān)注了整個(gè)業(yè)務(wù)運(yùn)行情況。事實(shí)上,服務(wù)器的狀態(tài)只是業(yè)務(wù)運(yùn)行狀態(tài)的一部分。
    曾經(jīng)有一個(gè)案例,用戶遇到收費(fèi)系統(tǒng)跨掉的情況,信息中心的主任當(dāng)時(shí)很驚訝,為什么會(huì)跨掉?這是不可能的,系統(tǒng)有監(jiān)控系統(tǒng),跨掉會(huì)告警的。經(jīng)過我們的調(diào)查和分析,發(fā)現(xiàn)最近發(fā)生了大量ARP的行為,我們通過運(yùn)維管理系統(tǒng)進(jìn)行了監(jiān)視,發(fā)現(xiàn)這些ARP包都是從某個(gè)IP地址發(fā)出來(lái)的,把這個(gè)IP地址所對(duì)應(yīng)的網(wǎng)絡(luò)設(shè)備端口關(guān)掉,系統(tǒng)就好了,我們不用主動(dòng)去找使用者,他上不了網(wǎng)自然會(huì)打電話過來(lái),最終查出來(lái)就是這個(gè)IP地址的使用者導(dǎo)致了收費(fèi)系統(tǒng)的癱瘓。
    網(wǎng)絡(luò)位置是不能有移動(dòng)的,利用仿真技術(shù),模擬員工的行為去訪問它。這樣就可以通過仿真模仿用戶的訪問來(lái)保證業(yè)務(wù)系統(tǒng)的正常運(yùn)行。最后才是監(jiān)控服務(wù)器內(nèi)部的進(jìn)程是不是正常,通過全面的監(jiān)控才能保證整個(gè)業(yè)務(wù)系統(tǒng)是好的。我們的服務(wù)目的是保證業(yè)務(wù)的順利進(jìn)行,所以我們要進(jìn)行全方位的監(jiān)控。
    層次化綜合管理是大勢(shì)所趨
    各個(gè)管理員都有自己的權(quán)限和區(qū)域,整個(gè)大網(wǎng)絡(luò)不可能用一套系統(tǒng)管理,一旦網(wǎng)絡(luò)規(guī)模上去了,層次化的管理是非常重要的,目的是保證有問題的時(shí)候上級(jí)可以管到下級(jí),在物理上分平臺(tái)但是邏輯上是整體。我發(fā)現(xiàn)某一個(gè)地方的IP地址有病毒,層次化管理就是所查找的區(qū)域即使不是本地的網(wǎng)管平臺(tái),也可以很快定位到下邊某個(gè)縣、市的交換機(jī)平臺(tái)端口上,否則我們無(wú)法實(shí)現(xiàn)綜合管理。
    以低成本易用性滿足實(shí)際需求而不改變規(guī)則是首要考慮的
    首先要考慮的問題是實(shí)施管理的代價(jià)。這個(gè)系統(tǒng)要花多少代價(jià),并不是指購(gòu)買產(chǎn)品多少代價(jià),你還要考慮設(shè)備和人力的投資,這些都是非常重要的。我買了一個(gè)管理產(chǎn)品來(lái),必須要請(qǐng)一個(gè)高管的人,必須要基礎(chǔ)設(shè)施改過,這也是非常大的。必須要考慮管理代價(jià),規(guī)則的制定也是非常重要的,我上了管理系統(tǒng)必須根據(jù)管理工具把整個(gè)企業(yè)的管理思路和規(guī)則重新制定一下,這是不行的。我們遇到過這方面的情況。PC桌面管理,早在2000年的時(shí)候,可以算是一個(gè)前衛(wèi)的概念,在國(guó)內(nèi)鮮有成功案例,但有一個(gè)企業(yè)敢為天下先,部署了一套美國(guó)產(chǎn)的的桌面管理系統(tǒng),主要是進(jìn)行PC行為管理和監(jiān)控。當(dāng)時(shí),是臺(tái)灣的一家公司負(fù)責(zé)實(shí)施的,施工長(zhǎng)達(dá)兩個(gè)月,結(jié)果用了多長(zhǎng)時(shí)間呢??jī)蓚€(gè)禮拜,原因是實(shí)在沒有辦法用了,他試圖去改管理規(guī)則和控制人的行為,監(jiān)控人家的桌面。上面的生產(chǎn)部門不愿意了,你憑什么看我的桌面和控制我的行為,我想炒股和玩游戲是正常的,最后有的人就把機(jī)器搞壞了,最后只能放棄?,F(xiàn)在的PC桌面管理用戶用的更多的是資產(chǎn)統(tǒng)計(jì)等,而不再?gòu)?qiáng)調(diào)控制人的行為,這不是信息部門做的事情,是企業(yè)整個(gè)規(guī)章制度制訂了,總經(jīng)理辦公室下命令了才能做,不下命令是不能做的。不要試圖改變游戲規(guī)則,否則是很難的。
    減少對(duì)環(huán)境的依賴,不要對(duì)完成有太大的依賴
    某個(gè)管理思路很好,但要在服務(wù)器上加一點(diǎn)東西,結(jié)果沒有人敢做這件事。原因很簡(jiǎn)單,因?yàn)闃I(yè)務(wù)系統(tǒng)很重要,萬(wàn)一出了問題說(shuō)不清楚。對(duì)國(guó)內(nèi)的產(chǎn)品來(lái)說(shuō),你要用戶把一本說(shuō)明書讀懂是不太可能的,興趣就是15分鐘上去看到的功能是有的,沒有看到的就不能。另外不能依賴上門服務(wù),你要養(yǎng)多少人上門呢?要提供遠(yuǎn)程技術(shù)支持,你在操作過程中碰到問題了,不會(huì)使用了,但只要能夠上互聯(lián)網(wǎng),就可以在你的機(jī)器上操作,就可以看到了,你一年獲得一百次服務(wù)都是沒有問題的。優(yōu)勢(shì)簡(jiǎn)單說(shuō)一下,就是易用性、主動(dòng)性、實(shí)用性、擴(kuò)展性、便捷性。
    運(yùn)維管理系統(tǒng)的發(fā)展思想是應(yīng)該按照用戶的需求來(lái)考慮的
    給大家講一個(gè)廣交會(huì)的案例,大約有16000個(gè)布線點(diǎn),每次開會(huì)的時(shí)候有13000臺(tái)電腦接入,在03年前是無(wú)法用的,上網(wǎng)下訂單、發(fā)傳真,而03年1萬(wàn)多電腦接入不能保證是否有病毒,造成了網(wǎng)絡(luò)癱瘓。每次開會(huì)傳真排隊(duì)非常長(zhǎng)。03年的時(shí)候他們改造成線速交換機(jī),三層架構(gòu)。04年初開廣交會(huì),網(wǎng)絡(luò)不癱了,但是互聯(lián)網(wǎng)端口堵塞,大家還是沒有辦法上。正好,運(yùn)維管理系統(tǒng)給他們提供了一個(gè)解決方案,在端口放了一個(gè)探針,只要有異常的馬上告訴用戶,通過運(yùn)維管理系統(tǒng)的IP定位功能,查看問題到底出現(xiàn)在什么地方的哪個(gè)交換機(jī)的幾號(hào)端口,把那個(gè)端口關(guān)掉,然后像管理員報(bào)警,管理員再去殺毒。憑借擁有對(duì)病毒和異常訪問的屏蔽功能,廣交會(huì)最終選用了BTNM網(wǎng)絡(luò)運(yùn)維管理系統(tǒng)。以前的那種加帶寬,增加硬件來(lái)擴(kuò)充帶寬試圖做到防止問題的發(fā)生是不正確的,管理是預(yù)防為主,有幾千臺(tái)機(jī)器有問題在實(shí)際管理中是無(wú)法快速有效解決的,要把問題屏蔽在網(wǎng)絡(luò)之外,達(dá)到我們服務(wù)的目的。
    網(wǎng)絡(luò)運(yùn)維管理的那些事兒,說(shuō)到底還是要從基礎(chǔ)設(shè)施抓起,俗話說(shuō)高樓平地起,基礎(chǔ)設(shè)施完善的業(yè)務(wù)平臺(tái)才可能為用戶創(chuàng)造真正的價(jià)值。