因為公司的某項業務有需求,所以自今年初就進了兩台 N 牌的 Server 及一台 Storage,然後安裝了 Windows 2008 Server 並以此組成容錯叢集(Cluster)。

但是在第一次安裝完成後,並且也把所有的服務程式安裝完成、資料庫轉移完成上線服務。但是,就在上線了約兩個禮拜後,取得控制權的第一台 Server 突然出現微軟慣有的藍底白字當機畫面……

 

當然這個時候 Cluster 就發揮了他應有的公用,Service 直接跳到第二台 Server 去了,但是在重啟第一台 Server 後卻發現……它回不去了!
不管再怎麼呼喚它,它就是一直處於離線狀態,然後試著將它從 Cluster 收回,這一收更不得了了!

試著要將它重新加回 Cluster 中卻是一直加不回啊~~~

 

於是乎 Call 了廠商協助把 Server 重灌、Cluster 重建,功能測試沒問題後再度上線使用,然後在 Run 了兩個禮拜後,它……又掛了!這次是在某一台 Server 的網路線被移除後,那一台一樣是……回不去了!

 

一直折騰到今年的九月份,真的沒辦法了,所以乾脆就讓廠商整組打包帶回他們公司去測試。
然後在過了約一個禮拜後,終於廠商說找到問題點了,並且把 Server 帶回公司機房上架,並且重建所有的環境。

 

根據廠商所提供的訊息,他們所得到的結論是:

1、原先在架設 Windows Server 2003 時,兩台 Server 除了接兩條對外的網路線外,中間還必須靠一條網路線來「偵測彼此的心跳聲」!

2、在 Windows Server 2008 的環境下,其實是不需要那一條串接的網路線來偵測彼此的!

3、所以,前兩次的狀況應該都是多了那條線的緣故!

 

但是…但是…在第三次的安裝完成後,原本想說沒問題了。
不過,在某一次的測試後發現,只要其中一台 Server 重新開機後,唉!
還是回不去呀~

 

跟廠商討論、測試了許久,後來發現竟然「可能是」防毒軟體所造成的問題呀!

底下先來看看我的環境吧~

硬體:

1、NEC 5800 Server 兩台。

2、NEC Storage D3-10 一台。

軟體:

1、Windows Server 2008 x64 SP2

2、Windows Server 2003 AD 環境

3、Symantec Endpoint Protection 11.0.6 MP3 x64 Client

 

試著將兩台 Server 上的賽門鐵克(SEP)防毒軟體移除後,原先回不來的那台 Server 竟然奇蹟式的自己找到家了!它~回來了~

 

後來在同事的協助下,找到賽門鐵克上針對 Cluster 的解決方案:

1、Installing a Symantec Endpoint Protection client to a cluster server
2、How to exclude 2008 R2 Cluster Shared Volumes from Symantec Endpoint Protection

 

然後又發現,其實 Windows Server 2008 Cluster 是靠 IPv6 的機制來通知 Cluster 彼此是否還「活著」?

但是,賽門鐵克安裝完成後是預設會去檔 IPv6 的流量的!
因此,當我的其中一台 Server Fail 並在復原後,它就無法透過 IPv6 去告訴 Cluster 說它已經正常了!

 

最後,參考了一些網路資訊後,歸納了以下在 Cluster 上安裝賽門鐵克(SEP)防毒軟體的步驟:

01、在賽門鐵克 Server 管理控制台中(SEPM)將阻擋 IPv6 的選項取消。

02、先將 Cluser 中非活動的那台 Server(我們稱它為 A 好了)從 Cluster 節點中移除。

03、在離線狀態下將 Server A 安裝 SEP Client 並重新開機。

04、在活動的那台 Server(我們稱它為 B 好了)將 Server A 加回 Cluster 節點中。

05、將 Server B 從 Cluster 節點中移除,此時 Server A 取得控制權。

06、參考下圖,在 Server A 上將叢集仲裁磁碟(Quorum Disk)、分散式交易調節器磁碟(MSDTC)、及一些相關的副檔名加入 SEP 的「集中式例外」中。

07、在離線狀態下將 Server B 安裝 SEP Client 並重新開機。

08、在 Server A 上將 Server B 加回 Cluster 節點中。

09、將 Service 切換到 Server B 上。

10、參考下圖,在 Server B 上將叢集仲裁磁碟(Quorum Disk)、分散式交易調節器磁碟(MSDTC)、及一些相關的副檔名加入 SEP 的「集中式例外」中。

11、完成。
Cluster_SEP

 

經過以上的安裝步驟後,果然不管我兩台 Server 再怎麼重開機、網路線再怎麼拔來拔去的,果然 Cluster 上的兩個節點依舊是活的好好的。

終於,將近一年的 Trouble 終於找到了答案,也讓業務得以繼續進行……



0 留言

很抱歉,此文章關閉留言

網站搜尋

Copyright 2011 就是教不落 | Theme Sco v5.0 By:Scorpio

无觅相关文章插件,快速提升流量