北京三木聯(lián)合信息技術有限責任公司
ROSE HA在系統(tǒng)故障時的自動切換能力
當系統(tǒng)出現(xiàn)故障時(如:系統(tǒng)宕機、HA進程/應用進程被殺掉、RS-232、SCSI、光纖、網(wǎng)絡線纜斷開),Rose HA 將確定故障原因,并采取相應對策,并將這些應用切換到備份服務器上。而故障服務器中未受影響的應用不會被切換,既不會受任何影響。不需要系統(tǒng)管理員干預。
ROSE HA的自動檢測
在集群系統(tǒng)的每一臺服務器內(nèi),RoseHA具有兩個核心進程,它們互相監(jiān)控,如果其中一個進程失敗,另一個進程會立即進行恢復。
ROSE HA實現(xiàn)服務器的可靠性
在主服務器出現(xiàn)故障(如掉電或宕機)時,另外一臺服務器接管故障服務器上運行的所有的關鍵性應用。
ROSE HA實現(xiàn)網(wǎng)絡可靠性
如果服務器的網(wǎng)絡部分發(fā)生故障,會導致客戶不能連接和訪問到服務器,這同樣是致命的故障。如果該服務器配備了冗余的網(wǎng)絡接口,Rose HA會使用它來恢復網(wǎng)絡連接。在沒有配備冗余的網(wǎng)絡接口,或者所有的網(wǎng)絡接口均出現(xiàn)故障時,HA會將該應用切換到另外一臺服務器上。切換完成后,客戶在短暫的切換過程后能夠繼續(xù)訪問所需的服務。
ROSE HA實現(xiàn)存儲可靠性
需要將應用的全部數(shù)據(jù)存儲在兩臺服務器都能訪問到的共享磁盤中。建議使用磁盤陣列來存儲數(shù)據(jù),這樣可以避免單點固障,而且便于對系統(tǒng)的容量進行擴充。對由Volume Manager軟件管理的磁盤陣列,Rose HA提供了相應的處理程序,以保證磁盤陣列及數(shù)據(jù)的可靠性。
ROSE HA的應用可靠性
在高可用性系統(tǒng)中可以運行多個應用。每一個應用是作為一個服務而存在的。在服務器中,當某個服務失敗而其它服務正常運行時,Rose HA將處理這個失敗的服務。在將這個服務切換到另一臺服務器上時,該服務器上運行的服務也不會受到影響。對于與網(wǎng)絡不相關的純數(shù)據(jù)應用,只需要切換數(shù)據(jù)存儲和數(shù)據(jù)處理軟件。而在與網(wǎng)絡相關的客戶機/服務器應用,除了要切換數(shù)據(jù)存儲和數(shù)據(jù)處理軟件外,還需要切換相關的虛擬IP。如果希望兩個服務獨立地進行切換,則此兩個IP地址不能相同。如果使用了相同的IP地址,在發(fā)生切換時,Rose HA會將所有使用該IP的服務都切換到另外一臺服務器上去。
ROSE HA豐富的附加功能
提供不同的針對特定應用的Agent程序,使服務監(jiān)控更切實際,更加有效;提供用于開發(fā)Agent程序的應用程序界面(API),使用者可針對特定的服務編寫Agent程序,執(zhí)行與特定服務相關的狀態(tài)診斷及錯誤恢復工作的。