網絡技術飛速發展,計算機網絡被廣泛應用于學校、科研部門、政府機關及商業等各個領域。網絡管理的好壞將直接影響網絡的有效使用,其中對于服務器的安全維護十分重要。服務器的管理維護包括軟件和硬件兩個方面,哪一方面出問題都會讓服務器運行出現故障甚至癱瘓。下面就給大家說一說本人在實際中遇到的一次HP服務器故障排除。
HP服務器故障排除一、出現故障
筆者單位使用的是HP NetServer LH3000服務器組成的局域網,自從建網以來服務器硬件一直良好。但有一次啟動服務器后發現有問題,剛開始自檢運行都正常,等到進入Windows2000主畫面時,發現服務器主機內的噪音變大,開始認為是系統軟件加載錯誤導致的,多次重新啟動服務器,有時重啟后正常維持時間稍長,有時稍短。等到系統啟動完畢后,注冊進入系統,打開管理工具,查看系統日志,沒有發現故障提示。
HP服務器故障排除二、故障的排除
于是我們懷疑是感染了病毒,把服務器設置成從軟盤驅動器啟動,用KV3000殺毒王引導盤啟動服務器,之后掃描硬盤,查完后未發現病毒,排除了病毒感染的可能性。又懷疑與BIOS有關?檢查BIOS設置,查出版本號,到惠普網站查詢,找到了對應的新BIOS版本,于是決定升級BIOS試一試。先到惠普網站下載了***的BIOS升級程序,拷貝到軟盤,為了保險,先將服務器現在的BIOS備份后再升級。從軟盤引導系統,運行升級程序,大約25分鐘之后,升級終于順利完成。再啟動進入BIOS設置,改為硬盤啟動。重啟服務器,進入系統后,過了一會兒,故障依舊。至此,我們才轉向服務器的硬件檢查,打開了機箱,檢查電源風扇,運轉正常,粗略檢查其它風扇也未見異常。***請HP專業維護人員來,并將系統I/O控制板和電源控制板予以更換,更換重啟服務器后,問題仍未解決。于是開始全面檢查服務器,在服務器面板主菜單中查看,意外發現“Event Log”中的“System Event”下有一提示,顯示“Fan Slow”。于是我們重新打開機箱,認真檢查每組風扇,由于服務器內部有多組風扇,各自負責不同控制板的散熱。分別檢查,終于在機器隔板下的隱蔽處找到兩組風扇,其中有一組風扇停轉。原因找到后,換上新風扇再啟動服務器,聲音小了。運行一切正常。至此服務器故障得以排除。
HP服務器故障排除三、故障排除分析
從以上故障排除過程得知,HP NetServer LH3000服務器的面板日志記錄中記載著系統每次啟動和關閉時的硬件檢測信息,如果系統出現故障,我們可以直接查看系統事件,以便快速診斷故障部位,這將起到事半功倍的作用。現將HPNetServer LH3000服務器面板的主要內容簡單介紹一下:
Event Log
Fw lnfo:主要是一些設備信息,如BIOS版本號等。
System lnfo:主要是硬件信息,如CPU主頻、型號、CPU號(多處理器)、L2Cache、內存容量及所在插槽等。
Component lnfo:主要是產品標號、序列號等。
Service:記錄一些服務信息。
Adjust Contrast:調整面板顯示的對比度。
按面板右側的上下箭頭,選擇進入子菜單;當光標處于“Event Log”時回車進入,選擇“System Event”再進入,即顯示系統引導、死機、管理、硬件故障信息等內容。通過查看記錄即可知道異常情況的原因及時間等信息,為解決問題提供依據。
HP服務器故障排除四、經驗總結
HP服務器出現噪音變大的故障,初期可能只是風扇轉速減慢,系統還能繼續工作,但由于系統負荷逐漸加大,環境溫度升高,使服務器內部溫度升高,加大了風扇的負荷,最終導致一組風扇損壞,將排風散熱的工作由另一組風扇負擔,系統初始啟動時,系統產生熱量較小,一組風扇還可以承擔。當系統運行一段時間后,機箱內溫度開始升高,當系統檢測到溫度已超過其閾值時,于是發出指令提高風扇轉速,加速散熱,從而導致服務器主機內的聲音突然加大。如果各組風扇都運行正常,則可以保證服務器主機內的溫度在正常范圍內,從而保證系統正常運行。
在檢查服務器的硬件問題時,***先查看服務器面板主菜單“Event Log”的內容。由于服務器事件存儲容量有限,應定期備份記錄,否則溢出后新事件將無法記錄,會導致系統實時信息丟失,不利于排查故障。建議用Navigator CD制作DiagTools啟動軟盤,需兩張軟盤。定期用軟盤啟動服務器,啟動后回車,即選擇Diagtools和Event Log Display Utility Ver 3.12,進入Event Log Display Utility Ver 3.12,即可導出Event Log記錄;否則按“ESC”,只有Diagtools不能導出事件日志。還可以通過Diagtools工具檢查系統,保證系統的安全。