提到IT系統的管理人員,相信大多數人腦子裡首先出現的詞匯是……“網管”--網絡管理員。但是,IT系統的管理絕不僅僅限於網絡管理,服務器與存儲的管理也是不可或缺的組成部分。
我們知道,“網管”概念的廣為人知,與思科大力推動其網絡認證所做的宣傳不無關系。而在存儲領域,六七年前調研公司Gartner也曾提出過與網管相對應的“存儲管理員”,惜乎沒能堅持下來。現在,又有人更進一步,認為企業需要“存儲經理人”……真的需要嘛?如果是的話,這個位置的職責都包括哪些呢?
服務器、網絡和存儲管理的不同之處
在一個企業中,通常情況下CIO(首席信息官)是公司IT軟硬件資產及其運營方面的最高分管負責人。根據企業規模的不同和數據中心業務的大小,CIO下面可能會有系統管理員(SystemAdministrator)/工程師--主要負責服務器硬件和操作系統方面;網絡管理員--負責公司/數據中心內部局域網和外部廣域網的連接拓撲,涉及到包括交換機、導向器、路由器,還有線纜的部署規劃等;軟件工程師--其中可能還要分應用軟件(開發、維護)工程師和數據庫工程師(DBA)……
從硬件角度上,數據中心裡的硬件,除了電力和冷卻這些運營的先決基礎設施之外,主要是服務器、網絡和存儲設備3個大類。對於網絡而言(這裡主要指以太網,不包括存儲網絡),思科占據了這個市場的霸主地位,接下來還有Juniper、BLADE(已被IBM收購)、博科(原Foundry)和華為等廠商。因此,網絡管理員需要熟悉用到的這些公司的產品。
談到服務器,除了一部分關鍵應用運行在IBMAIX、HP-UX、Oracle/SunSolaris(SPARC)系統的RISC架構小型機和大機上,更多的主流應用都是跑在基於x86的Windows/Linux平台,也就是以IntelXeon或者AMDOpteronCPU為核心。
IBM、惠普和戴爾等公司都在服務器的管理方面(軟硬件結合)下了自己的功夫,由於本文重點是討論存儲這部分就不過多展開。進入虛擬化時代之後,出現了很多針對數據中心虛擬化環境推出管理軟件的小廠商,虛擬機確實在原有的物理服務器基礎上增加了管理方面的難度。而同時增加的,還有數據的蔓延(容量),和對存儲設備更高的性能要求。
不同企業存儲廠商在軟硬件之間的差別,可不像各品牌標准化的x86服務器之間那樣簡單。首先在硬件上,除了Intel/AMD的x86處理器,還有不少的產品使用PowerPC甚至Power(如IBMDS8000系列高端磁盤陣列)等RISC架構。有些外觀形態上做成接近存儲服務器的樣子,還有的采用SBB規范的機箱結構設計,但控制器的電路板等設計卻沒有一定之規。
類似的還有軟件,最簡單的可能是使用WindowsStorageServer系統的NAS(網關)產品,但這些絕對不是主流,有的廠商在Windows(甚至XP)內核上進行大幅精簡和優化,而更多的則是基於各種不同的Linux版本來開發。於是不同品牌、甚至不同系列存儲系統的管理軟件界面都不一樣,盡管它們在連接服務器的存儲通信協議上面一般都是標准的。由之而來的,就是各個廠商存儲產品之間的較大差異性和特點,從硬件上講他們應該比PC和服務器業務產生更多的毛利率,但研發上的成本也會相應增加。這給一些相對小的廠商創造了機會,比如去年被惠普收購的3PAR、戴爾收購的Compellent還有被EMC納入囊中的Isilon.當然也有只做存儲業務的公司達到比較大的規模,就像EMC和NetApp那樣。
因此我們也會在本文中討論一些業內所公認的標准化技術,大家可能或早或晚的都會提供支持,只是不同廠商在底層實現的方式也許會大相徑庭。
那麼是否需要有專人來負責存儲方面嗎?筆者覺得這要看企業IT的規模、存儲設備(磁盤陣列、磁帶系統等)的多少,以及需要管理的數據量等多方面因素來決定。有些情況下,系統管理員和網絡管理員可能會分擔存儲管理方面的工作。但如果一家公司使用了數量較多的不同品牌、不同檔次的存儲系統、磁帶備份設備、光纖通道交換機和數據保護軟件,設有專職的存儲管理員(或稱存儲經理人)還是有一定好處的。畢竟您不會希望存儲方面出現一點小的狀況都需要廠商/服務提供商的工程師上門來查看,存儲管理員可以和他們接口並提高企業存儲軟硬件的運行效率,進而節約公司的IT成本。
存儲經理人也好,存儲管理員也罷,可能會涉及到的工作有以下幾個方面。
一、存儲系統相關的管理:包括各種各樣的DAS、SAN、NAS存儲系統(磁盤陣列)和裡面使用的驅動器,以及存儲虛擬化設備等。
對於RAID陣列而言,在幾年前有人認為只要讓它們能夠正常工作,通過基本的管理功能在平時監視其狀態就好了。不過,現在的存儲系統軟件功能越來越豐富,在使用這些提高您的存儲效率之前,我們需要經過一個了解--分析/評估--預部署/測試的過程。
自動精簡配置
自動精簡配置(ThinProvisioning)的工作原理是:在創建“瘦”卷時,預分配一個虛擬的邏輯卷容量大小,而只是在實際寫入數據時才分配物理空間給這個卷。這樣我們可以輕易的創建出總邏輯容量超出物理磁盤空間的多個“精簡卷”,而無須為將來可能達到的數據量提前“買單”.在應用產生的數據確實需要增加驅動器時,我們也可以靈活地在線調整卷的大小。我們在享受自動精簡配置帶來好處的同時,也要投入一定的管理精力在上面,或者說熟悉它的規則。
自動分層存儲
自動分層存儲技術通過將頻繁訪問的“熱”數據移動到高速且昂貴的SSD固態驅動器或者15KRPM機械硬盤,而將訪問頻率較低的“冷”數據存放在大容量/廉價的7200RPM近線驅動器中,來實現改善存儲效率、提高性能和降低單位容量成本的作用。如果說自動分層存儲給人們帶來了很大的幫助,這個當然毫無疑問。不過同時我們也要在規劃、實施和後期管理/監控過程中投入一部分精力。
存儲虛擬化
我們曾經在“用戶眼中的SVC:盛大在線CTO朱敬談存儲虛擬化”這篇采訪中討論過存儲虛擬化為用戶帶來的價值,以及上海盛大在線選擇IBMSVC的原因。總的來說,存儲虛擬化設備是介於存儲網絡中間的一層,將後端連接的存儲系統虛擬化整合起來、集中管理,並可以在上面統一執行自動精簡配置、快照/復制/鏡像保護,還有分層存儲等功能。部署存儲虛擬化會涉及到對原有存儲網絡的改變,比如光纖通道交換機的端口分配和連接,如果規劃不合理有可能會在ISL(交換機間互連)等處形成新的瓶頸。IBM的SVC市場經理ChrisSaul建議用戶在部署SVC前首先進行系統規劃練習。由存儲虛擬化帶來的工作量和人員時間投入也是不少的。存儲虛擬化設備通常還能提供容災方面的功能,這些就是我們接下來要談的部分。
快照、復制和鏡像
如今,快照、復制和鏡像這些基本的數據保護功能幾乎已經成了高、中、低端企業級存儲系統的標配--譬如IBM去年發布的入門級SAN陣列SystemStorageDS3500。
快照的概念想必大家都不陌生了,它是一種簡單的本地數據保護方式,主要用來應對一段時間(比如幾分鐘~一個月)之內的邏輯錯誤。它不等同於備份,因為被保護的數據內容仍然在這台存儲設備上面,在需要的時候我們可以切回到某一時間的快照點,或者刪除不再需要的快照來釋放磁盤空間。
快照還可以作為磁盤陣列之間的復制的基礎,比如像IBM存儲系統可選的FlashCopy(閃速拷貝),就可將FlashCopy快照與TivoliStorageManager備份軟件的功能結合使用。所謂同步鏡像,就是2台存儲上保存的內容完全一致。如果說本地鏡像的目的是進一步避免單點故障(盡管存儲系統的控制器、驅動器和電源等組件已經帶有冗余了),那麼遠程鏡像就是為了容災,或者是像IBMSVC和EMCVPLEX那樣的長距離VMware服務器虛擬機實時遷移。
鏡像功能對存儲網絡的帶寬和延遲的要求很高,如果達不到就會嚴重拖慢被保護系統的讀寫性能。在可用網絡帶寬有限的情況下,我們還可以通過異步復制來保護數據。