現場環境:
SUSE9SP3linux +VCS4.1MP4雙機
問題描述:
啟動VCS雙機報錯 #hastart dNFS_Disks urp9fs3 *FAULTED* group resource system message --------------- -------------------- -------------------- -------------------- fs3 STALE ADMIN WAIT: all systems stale fs4 STALE ADMIN WAIT: all systems stale 日志DiskReservation_A.log中報錯 2011/05/23 11:57:26 VCS ERROR V-16-10031-2005 DiskReservation:dNFS_Disks:monitor:GETSTAT failed. return=-1, errno=5, scsi=0x10000. 問題處理: 1. 檢查GAB(Group Membership Services/Atomic Broadcast),發現異常, #/sbin/gabconfig -a 屏幕顯示如下類似信息, GAB Port Memberships =============================================================== Port a gen f29111 membership 01 表明雙機心跳不正常,GAB 沒有通過驗證。 重新啟動該服務無效; 2. 檢查心跳地址,可以互相PING通,排除網卡問題; 3. 重新啟動服務器後檢查GAB已經恢復正常。 #/sbin/gabconfig -a 屏幕顯示如下類似信息,表明雙機心跳正常,GAB 通過驗證。 GAB Port Memberships =============================================================== Port a gen f29111 membership 01 Port h gen f29113 membership 01 4.啟動雙機依然報同樣錯。檢查配置發現多出一個.sale文件,正常情況下此文件是不存在的(stale表示過期) 5,刪除.stale文件後重啟雙機可正常啟動。