本文介紹如何利用Windows Server 2003軟件來搭建服務(wù)器集群。集群為資源和應(yīng)用程序提供高可用性、故障恢復(fù)、可伸縮性和可管理性。
1、Microsoft Windows 2003集群介紹
服務(wù)器群集是一組協(xié)同工作并運(yùn)行Microsoft群集服務(wù)(Microsoft Cluster Service,MSCS)的獨(dú)立服務(wù)器。服務(wù)器群集為資源和應(yīng)用程序提供高可用性、故障恢復(fù)、可伸縮性和可管理性。
服務(wù)器群集允許客戶端在出現(xiàn)故障和計(jì)劃中的暫停時(shí),依然能夠訪問應(yīng)用程序和資源。如果群集中的某一臺服務(wù)器由于故障或維護(hù)需要而無法使用,資源和應(yīng)用程序?qū)⑥D(zhuǎn)移到可用的群集節(jié)點(diǎn)上。
Windows群集(Windows Clustering)解決方案使用了名詞“高可用性”而非“容錯(cuò)”。容錯(cuò)技術(shù)提供更高層次的彈性和恢復(fù)能力。容錯(cuò)服務(wù)器通常使用深層硬件冗余,加上專門的軟件,幾乎可以即時(shí)地恢復(fù)任何單一的硬件或軟件錯(cuò)誤。這些解決方案要比Windows群集(Windows Clustering)解決方案昂貴得多,因?yàn)榻M織必須為處于空閑狀態(tài)等待錯(cuò)誤的冗余硬件支付費(fèi)用。
服務(wù)器群集無法保證無間斷運(yùn)作,但是確實(shí)能夠?yàn)槎鄶?shù)關(guān)鍵任務(wù)應(yīng)用程序提供足夠的可用性。群集服務(wù)可以對應(yīng)用程序和資源進(jìn)行監(jiān)控,并能夠自動識別和恢復(fù)眾多故障狀況。這為在群集中管理工作負(fù)荷提供了靈活性。另外,還提高了整個(gè)系統(tǒng)的可用性。
群集服務(wù)(Cluster service)的優(yōu)點(diǎn)包括:
• 高可用性:通過服務(wù)器群集,資源(例如:磁盤驅(qū)動器和Internet協(xié)議(IP)地址)的所有權(quán)會自動從故障服務(wù)器轉(zhuǎn)移到可用的服務(wù)器。當(dāng)群集中的某個(gè)系統(tǒng)或應(yīng)用程序發(fā)生故障時(shí),群集軟件會在可用的服務(wù)器上重新啟動故障應(yīng)用程序,或者將工作從故障節(jié)點(diǎn)分散到剩下的節(jié)點(diǎn)上。由此,用戶只在瞬間感覺到服務(wù)的暫停。
• 故障恢復(fù):當(dāng)故障服務(wù)器重新回到其預(yù)定的首選所有者的聯(lián)機(jī)狀態(tài)時(shí),群集服務(wù)將自動在群集中重新分配工作負(fù)荷。該特性可配置,但默認(rèn)禁用。
• 可管理性:您可以使用“群集管理器”工具(CluAdmin.exe),將群集作為一個(gè)單一的系統(tǒng)進(jìn)行管理,并對猶如運(yùn)行于一個(gè)單一服務(wù)器的應(yīng)用程序?qū)嵤┕芾怼D梢詫?yīng)用程序轉(zhuǎn)移到群集中的其它服務(wù)器。“群集管理器”可用于手動平衡服務(wù)器的工作負(fù)荷,并針對計(jì)劃維護(hù)釋放服務(wù)器。您還可以監(jiān)控群集的狀態(tài)、所有節(jié)點(diǎn)以及來自網(wǎng)絡(luò)任何地方的資源。
• 可伸縮性:群集服務(wù)可擴(kuò)展以滿足需求的增長。當(dāng)群集監(jiān)督應(yīng)用程序的總體負(fù)荷超出了群集的能力范圍時(shí),可以添加附加的節(jié)點(diǎn)。
本文檔提供有關(guān)針對連接到共享群集存儲設(shè)備并運(yùn)行Server 2003 Enterprise Edition或Windows Server 2003的服務(wù)器創(chuàng)建和配置服務(wù)器群集的指導(dǎo)。本文檔的目的是為了指引您完成安裝典型群集的步驟,并未解釋如何安裝群集應(yīng)用程序。而對于實(shí)施非傳統(tǒng)仲裁模型,如:多數(shù)節(jié)點(diǎn)集(Majority Node Set,MNS),的Windows群集(Windows Clustering)解決方案和地理位置分散的群集也不予以討論。關(guān)于服務(wù)器群集概念以及安裝和配置步驟的附加信息,請參見“Windows Server 2003在線幫助”。
服務(wù)器群集配置清單:
本清單幫助您進(jìn)行安裝準(zhǔn)備,其后接具體的步驟指導(dǎo)。
軟件要求
• 群集中的所有計(jì)算機(jī)均安裝了Microsoft Windows Server 2003 Enterprise Edition或Windows Server 2003 Datacenter Edition。
• 一個(gè)名稱解析法,比如:域名系統(tǒng)(Domain Name System,DNS)、DNS動態(tài)更新協(xié)議、Windows Internet名稱服務(wù)(Windows Internet Name Service,WINS)、HOSTS等等。
• 一個(gè)現(xiàn)有的域模型。
• 所有的節(jié)點(diǎn)必須是同一個(gè)域的成員。
• 一個(gè)域級帳戶,必須是每個(gè)節(jié)點(diǎn)上的本地管理員組的成員。建議采用專用帳戶。
硬件要求
• 群集硬件必須屬于群集服務(wù)硬件兼容性列表(Hardware Compatibility List,HCL)。要查找最新的群集服務(wù)硬件兼容性列表,請登陸位于http://www.microsoft.com/hcl/的Windows硬件兼容性列表(Windows Hardware Compatibility List),然后搜索“cluster”(群集)。整個(gè)解決方案必須得到HCL認(rèn)證,而不僅僅是個(gè)別組件。附件信息,請?jiān)贛icrosoft知識庫(Microsoft Knowledge Base)中參閱下方文章:
309395 Microsoft對于服務(wù)器群集和硬件的支持策略(The Microsoft Support Policy for Server Clusters and the Hardware)
注意:如果您正在存儲區(qū)域網(wǎng)絡(luò)(SAN)上安裝該群集,并計(jì)劃讓多個(gè)設(shè)備和群集與之共享SAN,那么該解決方案也必須服從“群級/多群集設(shè)備(Cluster/Multi-Cluster Device)”硬件兼容性列表。附加信息,請?jiān)贛icrosoft知識庫中參閱下方文章:
304415 針對附加到相同SAN設(shè)備的多群集的支持(Support for Multiple Clusters Attached to the Same SAN Device)
• 兩個(gè)超大存儲設(shè)備控制器——小型計(jì)算機(jī)系統(tǒng)接口(Small Computer System Interface,SCSI)或光纖通道(Fibre Channel);一個(gè)用于在其中一個(gè)域控制器上安裝操作系統(tǒng)(OS)的本地系統(tǒng)磁盤;一個(gè)面向共享磁盤的獨(dú)立的外圍組件互連( PCI)存儲控制器。
• 群集中的每個(gè)節(jié)點(diǎn)擁有兩個(gè)PCI網(wǎng)絡(luò)適配器。
• 將共享存儲設(shè)備附加到所有計(jì)算機(jī)的存儲電纜。參考關(guān)于配置存儲設(shè)備的制造商指南。參見本文后面的附錄,了解有關(guān)使用SCSI或光纖通道(Fibre Channel)所需的特定配置。
• 對于所有的節(jié)點(diǎn),一切硬件都必須是可識別的,對應(yīng)正確的插槽、設(shè)備卡、BIOS、固件修訂版等等。這將使配置變得更加簡單,同時(shí)消除兼容性問題。
網(wǎng)絡(luò)要求
• 一個(gè)唯一的NetBIOS名稱。
• 每個(gè)節(jié)點(diǎn)上的所有網(wǎng)絡(luò)界面均擁有靜態(tài)IP地址。 注意:服務(wù)器群集(Server Clustering)不支持使用由動態(tài)主機(jī)配置協(xié)議(Dynamic Host Configuration Protocol,DHCP)服務(wù)器分配的地址。
• 接入一個(gè)域控制器。如果群集服務(wù)無法驗(yàn)證用于啟動服務(wù)的用戶帳戶,可能導(dǎo)致群集發(fā)生故障。建議您在群集所在的相同的局域網(wǎng)(LAN)上擁有一個(gè)域控制器,以便確保其可用性。
• 每個(gè)節(jié)點(diǎn)至少必須擁有兩個(gè)網(wǎng)絡(luò)適配器——一個(gè)用于連接客戶端公用網(wǎng)絡(luò),另一個(gè)用于連接節(jié)點(diǎn)對節(jié)點(diǎn)專用群集網(wǎng)絡(luò)。HCL認(rèn)證要求一個(gè)專用網(wǎng)絡(luò)適配器。
• 所有節(jié)點(diǎn)都必須擁有兩個(gè)面向公用和專用通信的物理獨(dú)立的局域網(wǎng)(LAN)或虛擬局域網(wǎng)(LAN)。
• 如果您正在使用容錯(cuò)網(wǎng)卡或網(wǎng)絡(luò)適配器組合,確認(rèn)您正在使用最新的固件和驅(qū)動程序。向您的網(wǎng)絡(luò)適配器制造商核實(shí)群集兼容性。
共享磁盤要求
• 一個(gè)經(jīng)HCL認(rèn)可的連接到所有計(jì)算機(jī)的外部磁盤存儲單元。其將用作群集共享磁盤。建議采用某種類型的硬件獨(dú)立磁盤冗余陣列( RAID)。
• 所有共享磁盤,包括仲裁磁盤,必須在物理上附加到一個(gè)共享總線。
注意:以上要求并不適用于多數(shù)節(jié)點(diǎn)集( Majority Node Set,MNS)群集。這類群集本指南不予討論。
• 共享磁盤必須位于系統(tǒng)驅(qū)動器所用的控制器以外的另一個(gè)控制器上。
• 建議在RAID配置中創(chuàng)建多個(gè)硬件級別的邏輯驅(qū)動器,而不是使用一個(gè)單一的邏輯磁盤,然后將其分成多個(gè)操作系統(tǒng)級別的分區(qū)。這不同于獨(dú)立服務(wù)器通常所采用的配置。但是,它使您可以在群集中擁有多個(gè)磁盤資源,并跨節(jié)點(diǎn)執(zhí)行“活動/活動(Active/Active)”配置和手動負(fù)載平衡。
• 最小50兆字節(jié)(MB)的專用磁盤用作仲裁設(shè)備。為了得到最佳的NTFS文件系統(tǒng)性能,建議采用最小500 MB的磁盤分區(qū)。
• 確認(rèn)可以從所有的節(jié)點(diǎn)看到附加到共享總線的磁盤。這可以在主適配器安裝中進(jìn)行查看。請參考制造商的文檔,了解適配器指定的指導(dǎo)說明。
• 必須根據(jù)制造商的指導(dǎo)說明,對SCSI設(shè)備分配唯一的SCSI標(biāo)識號,并正確地將其端接。參見本文附錄,了解有關(guān)安裝和端接SCSI設(shè)備的信息。
• 所有共享磁盤必須配置為基本磁盤。附加信息,請?jiān)贛icrosoft知識庫中參閱下方文章:
237853 服務(wù)器群集磁盤資源不可用的動態(tài)磁盤配置(Dynamic Disk Configuration Unavailable for Server Cluster Disk Resources)
群集共享磁盤不支持軟件容錯(cuò)。
• 在運(yùn)行64位版本的Windows Server 2003的系統(tǒng)上,所有共享磁盤必須配置為主引導(dǎo)記錄(MBR)。
• 群集磁盤上的所有分區(qū)必須格式化為NTFS。
• 建議所有磁盤均采用硬件容錯(cuò)RAID配置。
• 建議最少采用兩個(gè)邏輯共享驅(qū)動器。