“不穩定”對於一些部門來說是比較普通的詞語,但是對存儲管理員來說這個詞語卻足以使他們發狂。當一個備份服務器變得不穩定或者不可靠,這不僅僅是故障……而是要保存故障。這使追蹤故障的引發原因變得很困難。對於備份服務器來說,這個問題相當尖銳,因為這台服務器的問題可以引起任何聯系的其他服務器的問題——從被備份的網絡到文件系統。這樣診斷起來相當的復雜。浙江電腦維修
廈門電腦維修
盡管引起備份服務器不穩定的詳細資料通常被很(一些可以說是“令人抓狂”)詳細地發布,仍然有一些你可以用來做依據的常規原則。長春電腦維修
可能最普遍的導致備份服務器不穩定的原因是修改系統參數來提高性能或者其它原因。要提高一個服務器的性能,你可以有很多手段去實施。然而,在一些方面,你如果修改的話,可能會使一些系統在某些方面不可用。因為這些不穩定並不是一直在已經混和的應用程序或者服務器內顯示出來。最重要的是保持一個修改的詳細記錄,這份記錄要讓所有管理員容易訪問。
另外一個普遍的導致服務器不穩定的原因是在系統內進行的修改,比如更新或者安裝插件。微軟的WindowsXP的ServicePack2導致很多遠程備份服務器的故障,因為它默認情況下激活WindowsXP的防火牆,並且備份軟件不能通過防火牆來傳輸數據。這種情況一般比較容易鑒別並且一般能夠通過把系統恢復到之前的、穩定的版本來解決,直到發現一個更穩定、更持久的修復出現。在這種更新或者添加新軟硬件導致的案例中,你最好的資源是廠商或者制造商那裡。
第三個主要導致備份服務器不穩定的原因是一些本身的改變。一個正常的進程、累計的硬件故障或者在系統內的使用方式的改變都能引起這些不穩定的狀況。例如,在微軟的SBS內,兩個普遍的導致備份故障的原因是:
一個SBS日志文件增加超過64兆
對設備進行過多的讀寫操作而引起的中止備份
在進行任何備份服務器故障的處理中,你的日志文件都是你最好的朋友,你應該做到每天讀取這些備份的日志,並且至少粗略地浏覽一下你的有關的備份事件的日志、當你的備份服務器開始出現問題,你需要大致地浏覽一下它們,並且可能讀取增加的事件日志來幫你找到什麼問題導致了服務器不穩定。
一定要對備份產生的錯誤信息格外注意,即使這個備份已經完全成功了。現代的備份系統令人難以置信地容錯能力可以使工作繼續進行——即使一些備份進程中報告一些錯誤。
在檢查你的日志時,對不清楚的超時要格外注意。一個不清楚的超時可能經常意味著一些無效地運行——至少——能意味著你可能在系統其它的地方有更大的問題。這種情況在備份進程在後台運行、並且與正規的工作相比有很低的優先級的時候尤其明顯。因為備份得到系統資源的一小部分,當一些事情出現故障的時候,備份經常成為第一個超時的進程。
(當然,僅僅是把事情復雜化,的確也有一些錯誤不需要注意,在你的廠商那裡查詢一下來看看他們告訴你那些錯誤消息的問題)
有一個很好的提問就是問問自己,當你的備份服務器出現異常情況時,是不是當服務器啟動以後,是否有其它使用同樣這些資源的東西?很明顯這是一個很廣泛的問題,因為一個備份服務器與很多其它的IT架構有聯系,與硬件、軟件、存儲設備和其它別的設備之間相互影響。
當一個真正的問題出現之後,最優先做的就是盡快讓備份服務器穩定下來。經常地,可以通過減少備份系統的負載(減少一些I/O或者投入更多資源)來使服務器穩定下來。