如果你已經實施了服務器虛擬化,你一定意識到整合的重要性,整合是虛擬數據中心最重要的考慮因素,簡單地說,整合增加了可用的計算機資源,允許在同一物理服務器上運行更多虛擬機,但即使目前最強大,最適合做虛擬化的服務器,整合也是有局限的,過度整合並不是好事,虛擬環境中的管理員必須考慮數據中心過度整合產生的影響。
整合已經無處不在,以至於我們差點忘了整合的本質意義:整合可以產生經濟效益--省錢。在傳統非虛擬化環境中,一台服務器通常只運行一個應用,服務器很少使用超過10%的計算機資源,每個新的服務或應用都會需要一定的服務器硬件、網絡、電力、制冷和維護等成本。
虛擬化將多個工作負載封裝到一台物理服務器,允許管理員使用更多的CPU、內存和I/O資源,需要的物理服務器數量就更少,因此電力和制冷成本也隨之下降。
此外,工作負載可以使用實時遷移在物理服務器之間移動,允許實時工作負載平衡,最小化因硬件維護或修理造成的停機時間,Windows Server 2008/R2數據中心版授權計劃使在相同服務器上托管虛擬機變得更具性價比。整合可以大大提高計算效率,並可以為企業節省更多成本。
服務器過度整合
正所謂物極必反,服務器整合本是一件好事,但過度整合不僅沒有幫助,反而有害,對數據中心和用戶來說都不是好事,不過現實中許多組織卻會明知故犯,問題在於虛擬化太容易了。
過去,要運行一個新的應用,意味著需要昂貴的服務器和人力成本開支,必須接受財務部門的審核和監管,這個過程可能會持續數周,甚至數月。虛擬化徹底改變了這個現狀,現在在物理服務器上創建一個虛擬機只需要幾分鐘,不涉及購買和安裝新硬件,成本只包含操作系統和應用程序許可費,IT決策和響應速度更快,按需分配計算資源已成為時尚。
有些組織常常讓服務器的負載過重,他們的目標是100%地搾干服務器的計算資源。Technology Navigator的總裁Todd Erickson說:“如果我購買了四路服務器和Windows Server數據中心版授權,那麼我能在它上面創建多少虛擬服務器呢?”顯然,這個問題沒有統一的答案。
過度整合首先影響到的是性能和穩定性,虛擬機相互搶奪有限的計算資源,應用程序也會打起架來,如備份,災難恢復和其它數據保護工具都是資源消耗大戶,它們是資源爭奪的重要參與者。雖然少數極端應用不會產生大的損害,但極端應用太多,虛擬機可能會崩潰,甚至整個服務器都會崩潰,大多數管理員都明白這一點,這與業務收入、客戶滿意度、數據安全都緊密相關。
托管了大量虛擬機的宿主主機發生故障會影響到所有虛擬機,這些虛擬機必須重新啟動,或留在原服務器,或轉移到數據中心其它服務器,恢復過程會給整個虛擬環境帶來巨大的壓力。
過度整合也會傷害到實時遷移功能,雖然大多數管理員不允許自動遷移,但按需轉移工作負載是虛擬化的優點毋庸置疑。不過,要想在服務器負載達到其極限時才轉移工作負載幾乎是不可能的,想象一下服務器出現故障時會發生什麼,你不能在其它服務器上啟動受影響的虛擬機,因為已經無計算資源可用,只有等服務器修復好後再重新啟動。
許多專家建議服務器整合要適度。一般來說,服務器資源利用率達到60-70%即可,真正的百分比還得看你的業務情況,但最終目標是要保留一定比例的計算資源閒置,因為重啟虛擬機是很占資源的,此外,保留的資源可用於在服務器之間遷移虛擬機、平衡工作負載或支持維護等工作。
預防服務器過度整合
預防服務器過度整合最簡單的辦法是從一開始就實施正確的IT最佳實踐,Erickson指出了過度消耗服務器計算資源的危害,他提出了一個自動精簡配置的解決辦法,例如vSphere和XenServer都支持內存過量使用功能,允許管理員供應比物理服務器內存還多的內存。
Erickson說:“沒有人把自動精簡配置作為最佳實踐,如果你正在實施自動精簡配置,你很可能已經觸及整合的極限,最大的問題是這會影響虛擬機的性能或穩定性。”
很多公司都喜歡在物理服務器上塞滿虛擬機,美其名曰資源利用最大化,例如一台物理內存只有48GB的服務器分配了52GB內存給虛擬機,過量使用了4Gb內存,雖然這個范圍是可接受的,但服務器已經整合過度了,隨時間推移,面臨的風險也越來越高。
合適的管理工具可以幫助識別過度整合的服務器,允許管理員在問題變糟之前解決,IT部門不應該等到資源被用光時才采取措施。
康涅狄格州South Windsor鎮信息技術主管Scott Roberts說:“你應該每天都打開管理控制台看看資源使用情況,不要等到前方用戶反饋問題才去查看”。
管理控制台提供的信息還可以幫助完成其它重要的任務,如工作負載平衡和容量規劃、分析虛擬機的分布情況以及它們需要的資源,然後生成建議,這些工具有時可以發現草率或低效的工作負載部署,容量規劃需要評估隨時間推移資源使用的變化情況,確保資源可滿足將來的需要。
分攤費用,防止濫用
限制虛擬機增長過快的另一個方法是考慮或重新評估組織扣款策略,扣款在很多組織中是一個很棘手的問題,在少量服務器上整合多個虛擬機只會使問題復雜化,組織可以將成本分派到使用這些計算資源的各個部門上,只有付費才能使用,部門才能體會到它的價值,也才不會濫用計算資源。
實現虛擬機生命周期管理也有助於預防虛擬機蔓延導致的資源浪費,VMware Lifecycle Manager(生命周期管理器)可以識別可能並不需要的虛擬機,移除這些虛擬機可以為其它虛擬機騰出更多的資源。不僅可以節省內存和CPU,移除不必要的虛擬機也可以節省存儲空間,消除多余的備份需求,說不定還可以推遲購買新服務器的時間,從而節省組織IT開支。
最後需要考慮的是新硬件在虛擬服務器整合中的作用,良好的硬件更換周期固然很好,但也容易陷入服務器過度整合的陷阱。此外,在考慮硬件更新時,也要考慮升級網絡的最佳時機,如10GbE或FCoE,因為高度整合的虛擬服務器必須要有更多網絡帶寬支撐。
延伸閱讀之一:何時應該避免整合
虛擬化平台在過去幾年取得了長促的進步,來自VMware、微軟和思傑的虛擬化產品幾乎可以支持任何類型的工作負載。一般來說,所有現代應用程序都可以在虛擬機上運行,但在制定轉移到虛擬平台的規劃時,IT管理員應小心謹慎。
舊應用程序在轉移到虛擬平台上時可能會遇到問題,特別是那些定制或需要特殊硬件支持的程序,因為虛擬化在應用程序和底層硬件之間強制增加了一個抽象層,那些需要訪問特殊硬件的應用程序可能會發生故障或遭遇不可接受的性能問題。
一個解決辦法是使用新的編程語言重寫應用程序,改造成與硬件無關的版本,但這種方法的成本很高,而且也很耗時。第二個辦法是購買可以自己修改的商業產品替換定制的應用程序,但需要的時間和成本也很高,說不定和修改現有定制應用程序的時間和成本相差無幾。
現實中,最簡單的辦法就是讓這些應用程序還是運行在非虛擬化的物理服務器上。此外,如SQL Server或Exchange Server耗資源的應用程序是可以放在虛擬機上運行的,但如果在相同物理服務器上還部署了其它虛擬機,則會存在性能問題。因此,資源密集型應用程序應最低限度地實施整合。
測試是整合過程重要的組成部分,應該脫離生產環境搭建起專用的實驗室環境,通過測試驗證應用程序是否適合部署到虛擬環境中,確定其需要的資源、性能表現和在虛擬環境下的互操作性。
延伸閱讀之二:跟蹤整合和性能
不管你要怎麼整合服務器,都應該使用基准測試工具或其它工具得出性能報告或計算資源水平,這樣用數字展示出應用程序性能或用戶體驗的效果會很佳。
在收到警報或用戶投訴時查看基准測試報告,通過基准計數器差異可以很快確定問題的根本原因,管理員可以觀察資源使用的變化情況,得出是否需要升級或新購服務器,還是重新平衡工作負載或做出其它容量規劃決策。
總之,服務器上托管的虛擬機越多,對服務器做任何調整受影響的應用也就越多,幸好三大主要虛擬平台都已經有對應的基准測試和報告工具,也有許多第三方工具可供選擇,如Novell的PlateSpin Recon和VK ernel Capacity Analyzer。