Vsphere HA

首先先到Datacenter裡面新增一個cluster,cluster就是把主機們變成一個叢集,是HA和DRS的必要條件。



這時候我們把開啟 vSphere HA打勾。















記住我們只是建完Cluster而已,記得把ESXI主機拉進Cluster才算完成。

這時候客戶會先問一個問題?為什麼會有這兩行組態警告,

此主機目前沒有管理網路重複

此主機的 vSphere HA 活動訊號資料存放區數目為 1,其少於必要數目:2

要注意這只是警告,就算不處理 HA 還是可以正常運作。

因為HA他的目的就是在於知道對方主機發生故障之後,我再去幫他把VM的機器開機。

那我怎麼知道對方主機是活的還是死的?會不會只是剛好網路不通而已。

所以ESXI做了三件事情確認,

1.我們可不可以透過管理網路知道對方。
2.我們可不可以透過共用的儲存空間知道對方。
3.我們能不能到達Gateway知道是我的網路不通還是對方網路不通。

這是為什麼通常兩台硬體做HA或用心跳線直接串再一起,不透過交換器。

因此要有兩條以上的管理網路,或是兩個以上的儲存空間都是為了避免這點。

就像醫院為什麼所有網路設備都要兩個,就是其中一個故障我們還可以使用另一個出去。









我們新增一片網卡插到switch上,然後把他都綁在原本的Vswitch上,因此我們就算隨便拔掉一張網卡,流量還是可以透過另外一張出去,兩台都要做。




我們重新整理HA,確實 此主機目前沒有管理網路重複 警告消失了。



我們再把原本NFS的儲存空間掛給他,這時 此主機的 vSphere HA 活動訊號資料存放區數目為 1,其少於必要數目:2 重新整理HA之後,警告也消失了。



目前這台主機是在開機狀態,而且是吃 Host 192.168.1.109的資源,他的儲存空間是在ISCSI,所以符合VMotion的條件



我們把109主機電源拔掉,過了一會兒當114發現跟109主機的心跳線死掉,他就會嘗試去開啟原本在109主機上的VM,這時候要特別注意,虛擬機是被拔電源的狀態下,被另一台ESXI強制重開,所以原本記憶體的東西會消失,虛擬機會顯示不正常開機,這時候如果你的服務沒有設定開機後自動啟用,還是會造成服務問題,正常來說如果你是Linux,有一個apache設成開機服務自動啟用,這樣服務中斷時間大約等於重開機時間

另外可以VMotion是可以HA的"必要條件",如果你還有掛local hd的光碟映像檔,或是主機位置就是放在local hd,另一台主機一樣開不起來。

我有錄了一段HA的影片請參考這邊:
https://www.youtube.com/watch?v=siiWhTq28_k



最後再提一點,HA的許可控制,什麼是許可控制?

想像一下如果我們有30個人要坐遊覽車出遊,每台車可以載30人,我們有兩台車,可以選擇兩台車各載15人,但是老闆覺得這樣太浪費空間了,所以再找另一團30人上車,但是其中一台車故障的話,如果只是各載15人,可以全部擠到另一台車,大家還是可以繼續旅遊,可是當你各載30人的話,當一台車故障的時候,另一台車就沒有空間載人了。

HA也是如此,如果你不事先預留資源的話,你把所有資源都吃滿,到時候有一台主機出事的話,其他台也沒有資源可以接手開虛擬機,因此許可控制就是事先預留資源,誰也不能使用,然後等一台主機掛的時候,其他台虛擬機才有保留的資源開機。

所以如果你只有兩台ESXI,當你開啟此功能時,你就會發現,你所有可使用的資源包含CPU、記憶體就只剩下一半可以使用,因為要確保一台死掉,另一台可以開啟所有虛擬機。

當然你也可以選擇停用,就是不保留,反正就遊覽車超載擠一擠出事再說,這也是台灣老闆最愛的作法。

結論:
VMotion是HA的必要條件,如果HA無法成功的話要先檢查VMotion的條件是否成立,另外雖然HA的設定很簡單,只有五分鐘就可以設完,但是其中資源的調配還有HA心跳線都是相當重要需要注意的地方,不然有可能產生大腦分離,就是兩台主機都認為對方故障,都想去開虛擬機,另外HA只是把對方虛擬機強制重開機,所以重開機當下的記憶體如果有包含交易資料也會消失,如果要解決的話需要使用FT,重開機的當下如果你的服務沒有設成開機自動啟到,也會造成服務中斷。


留言

這個網誌中的熱門文章

FortiGate 網路基本設定

Windows AD 架設

電腦的路由表設定