Vsphere HA
首先先到Datacenter裡面新增一個cluster,cluster就是把主機們變成一個叢集,是HA和DRS的必要條件。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgdQuc_mTT6NgwooD4tlT-KAiPQUXRUdCtLYyhmlUk9wlOLXjhYSLGpeB3yyD_HDv-nO70_tbXC5uJYKxT74tdb7IL9TrHncnejrsKzT3SAL2Wnf4fpToK74GOx3UNFv0Kq6hB04374swXx/s640/001.png)
這時候我們把開啟 vSphere HA打勾。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgtUte5vW2mE9sSdt-jGPV7urNqGrh1JnMKR7c85LwfI5SqpSk-617WWFnvAGyHL78c0JLM83PhyphenhyphenJz95jFKrCa3DwsLORH0RBQnqfT93DvTu81Qjp9Du2tRcYStHmFTa0NC1UqwvFpqr-Ze/s640/002.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgIKjeza1Ht8mnnzk2anRU3hL3yHQAgFRSLBoZ-v0x8xUcMTl91WEW8TWFj9xhsAku79kPA0m6fKbw7oNeyXyA7SgEIV0C6-GBhaLl7TuLICQczX5xs2FhKkaXE9Yo0BaJXk15z_APXZ3k9/s640/003.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh_5En6H4dp9gsMuMjCcrAmWeR7AN6hKUgO6u6XmptBMhs_ei2j6_YAQUWixa6naZk4Fo32qzSEgFL7_1xqzZ2NT1qKshLTMoT5mPMBo5N0xLcUPAG9RF7XVLvXCqPwitAxBeqWXH-YRSI5/s640/004.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgDEkfMntizt0hgyeIpzM87pVWBTjsWqF3S9tuxEEVyq3GnKu66nYOB-0lbqb07-FLfngweuuiH9k7MW74iaAej3K6MPJLmZ3022v90Hfz6Yg3LkCQUkemiq-nbRuC1B5XvxNNpFlr8lvoH/s640/005.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjwGgKu_aQO1qADjeuX36mHw8zJInif0FXKSNhUGxCckSd9K31k1B0KnVRZ1hs8NMncSeoGfeAwMsfSBEzjpe-gZ-IKEctMEOfUKRdeMRdhpxWVj4fC7D6qYSVEywPE89wch9cuwf1Rm_rz/s640/006.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhs8z2ykY_DLoLac0RLyiAPuXlzgDjVO5TexpIP_LIhBEyqI3QUccUiNOoOevt53W5kIQY35ytJS0E3QyCJPm9sXFESKBZSz19EV-Op8LS-71zPsGjPwUh4hULlNiLqt61LpWVbf48qTGfW/s640/007.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjTLl_Fwo3ICAfAiyGagJwYeZZuze4sNpIZcGMK3qFZJC9xo71gWRDcIQWVnQLoawFFpdLfgOLSZAb5h4u6Zbuv1thFM1CAm6ktzs0Ewe6BPTdM5MSDLFkUon7NmfM1QtPkccgjAyrcDJEG/s640/008.png)
記住我們只是建完Cluster而已,記得把ESXI主機拉進Cluster才算完成。
這時候客戶會先問一個問題?為什麼會有這兩行組態警告,
此主機目前沒有管理網路重複
此主機的 vSphere HA 活動訊號資料存放區數目為 1,其少於必要數目:2
要注意這只是警告,就算不處理 HA 還是可以正常運作。
因為HA他的目的就是在於知道對方主機發生故障之後,我再去幫他把VM的機器開機。
那我怎麼知道對方主機是活的還是死的?會不會只是剛好網路不通而已。
所以ESXI做了三件事情確認,
1.我們可不可以透過管理網路知道對方。
2.我們可不可以透過共用的儲存空間知道對方。
3.我們能不能到達Gateway知道是我的網路不通還是對方網路不通。
這是為什麼通常兩台硬體做HA或用心跳線直接串再一起,不透過交換器。
因此要有兩條以上的管理網路,或是兩個以上的儲存空間都是為了避免這點。
就像醫院為什麼所有網路設備都要兩個,就是其中一個故障我們還可以使用另一個出去。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjGbz6AqK7Cj1ya3SjpOXpsushfcO1NbmzY2fhYuWoMS8wxvXvkX38R6lBOT58kBa8QM4io43WVe9ZwVkk4nOp6HcwEvZhDvcnUZ8Ib0GKt2UT5J-OEAdKRp0pBrACrTSHRZFnnVkh6RZMl/s640/010.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgq2ZWvLDizglOWbpoJNeeB8AoHX2bSFqXmIBUwUVr0ypq3ozPrWHo-mv9G7T_VyLKNClxZmh3HskV3Vtfkv4fgnLGQPD3eRFku_LvzTGpPshLmCQhQ-Bpjcavfp8CatAhhT3uO1xQ_9kle/s640/011.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgbgZxv2kJeT_peppX8weJZi52tu2q5r58d2TotlKn9tbQEbCzGyMqquRTufOwBV60i_SGu0V7GM32h4eQF2qChaapZAqtGkicllPUB5Lp1E2ZnrBdwuSjbzr-r8Z41xKqWkCdWMfsewkMD/s640/012.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgdYwKlfEXDPcmH0oUX2dJExIcabVZc5zIYwrOFEHrZCDQ1MbelCFc3bM2j7ogIqeZ0U5im9Hf5qppGPIGyMQvxuFM-zwIa8I-cTTgldC6fuOT5PuHPkhzvEOD36f3nAkFrY2n9sNEwx084/s640/99.png)
我們新增一片網卡插到switch上,然後把他都綁在原本的Vswitch上,因此我們就算隨便拔掉一張網卡,流量還是可以透過另外一張出去,兩台都要做。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhMXaX7fqmehVICGhOjOp3MCbMNpRJyDql_XOxlKggkyCkGTA7xIBQvutMmwS1WhNquTUc2ZWqaNYU9chkU_8Z5GaxHd_UJr3uNojiDMPeG25HPoZ7KSA5OcAmE95WRI8qYhEU-fevhxHdx/s640/013.png)
我們重新整理HA,確實 此主機目前沒有管理網路重複 警告消失了。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgGPSvgN6rIZOAnk29-UaDgXA4Nuipf73EVsyhC__DTxXnfgQ8I486pOC_JCG91U6SGDqaoXkYUE6tHcQJ-zCM07s1xtlcxZ6dl3kw5wHjJYB4uUMUKAG-Xr27Vi53I8HK1zTttM_m9lYT2/s640/15.png)
我們再把原本NFS的儲存空間掛給他,這時 此主機的 vSphere HA 活動訊號資料存放區數目為 1,其少於必要數目:2 重新整理HA之後,警告也消失了。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhozlwUPgGD241zlj02ZsbGASAJUh8YYxh-YZRXXER2dHYsSOVbA49dnIkXKfigngvdshJ5-gh2e8Zv6UCH93vclaIIbu0NQtwSUIdIzHNAm4FPZPKT-TR2CK4_icwdjEQfivBxBZ_b5eqy/s640/16.png)
目前這台主機是在開機狀態,而且是吃 Host 192.168.1.109的資源,他的儲存空間是在ISCSI,所以符合VMotion的條件
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi9f_8KP7g-NtYq-sVmZdIcGbNC_Mqpo8CYBdDqra1EWBqRK6uzJaPCgQQwQFS4FzzUmz2GZ0BTL7ccMJ5y_43gx3DKjGQ4ixLm9aZoTuBfZ1UjI2Mqx11vkxSEiNHDs38Xn6kAxbsOLmrr/s640/17.png)
我們把109主機電源拔掉,過了一會兒當114發現跟109主機的心跳線死掉,他就會嘗試去開啟原本在109主機上的VM,這時候要特別注意,虛擬機是被拔電源的狀態下,被另一台ESXI強制重開,所以原本記憶體的東西會消失,虛擬機會顯示不正常開機,這時候如果你的服務沒有設定開機後自動啟用,還是會造成服務問題,正常來說如果你是Linux,有一個apache設成開機服務自動啟用,這樣服務中斷時間大約等於重開機時間。
另外可以VMotion是可以HA的"必要條件",如果你還有掛local hd的光碟映像檔,或是主機位置就是放在local hd,另一台主機一樣開不起來。
我有錄了一段HA的影片請參考這邊:
https://www.youtube.com/watch?v=siiWhTq28_k
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhk55fDUgMBzRhTaxEFNAgePaK18jZz4Gh2Jo1Cu-3T2QvE5hpwnKzZHGA5-NxsQLDpWXXo_2yv0Y1e4T6lLDkZ5sqVo1-wzgN5AR26vrPtqE95DjVlaDVWuDnNCsDGjK0fYps1OFnwl8Kr/s640/002.png)
最後再提一點,HA的許可控制,什麼是許可控制?
想像一下如果我們有30個人要坐遊覽車出遊,每台車可以載30人,我們有兩台車,可以選擇兩台車各載15人,但是老闆覺得這樣太浪費空間了,所以再找另一團30人上車,但是其中一台車故障的話,如果只是各載15人,可以全部擠到另一台車,大家還是可以繼續旅遊,可是當你各載30人的話,當一台車故障的時候,另一台車就沒有空間載人了。
HA也是如此,如果你不事先預留資源的話,你把所有資源都吃滿,到時候有一台主機出事的話,其他台也沒有資源可以接手開虛擬機,因此許可控制就是事先預留資源,誰也不能使用,然後等一台主機掛的時候,其他台虛擬機才有保留的資源開機。
所以如果你只有兩台ESXI,當你開啟此功能時,你就會發現,你所有可使用的資源包含CPU、記憶體就只剩下一半可以使用,因為要確保一台死掉,另一台可以開啟所有虛擬機。
當然你也可以選擇停用,就是不保留,反正就遊覽車超載擠一擠出事再說,這也是台灣老闆最愛的作法。
結論:
VMotion是HA的必要條件,如果HA無法成功的話要先檢查VMotion的條件是否成立,另外雖然HA的設定很簡單,只有五分鐘就可以設完,但是其中資源的調配還有HA心跳線都是相當重要需要注意的地方,不然有可能產生大腦分離,就是兩台主機都認為對方故障,都想去開虛擬機,另外HA只是把對方虛擬機強制重開機,所以重開機當下的記憶體如果有包含交易資料也會消失,如果要解決的話需要使用FT,重開機的當下如果你的服務沒有設成開機自動啟到,也會造成服務中斷。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgdQuc_mTT6NgwooD4tlT-KAiPQUXRUdCtLYyhmlUk9wlOLXjhYSLGpeB3yyD_HDv-nO70_tbXC5uJYKxT74tdb7IL9TrHncnejrsKzT3SAL2Wnf4fpToK74GOx3UNFv0Kq6hB04374swXx/s640/001.png)
這時候我們把開啟 vSphere HA打勾。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgtUte5vW2mE9sSdt-jGPV7urNqGrh1JnMKR7c85LwfI5SqpSk-617WWFnvAGyHL78c0JLM83PhyphenhyphenJz95jFKrCa3DwsLORH0RBQnqfT93DvTu81Qjp9Du2tRcYStHmFTa0NC1UqwvFpqr-Ze/s640/002.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgIKjeza1Ht8mnnzk2anRU3hL3yHQAgFRSLBoZ-v0x8xUcMTl91WEW8TWFj9xhsAku79kPA0m6fKbw7oNeyXyA7SgEIV0C6-GBhaLl7TuLICQczX5xs2FhKkaXE9Yo0BaJXk15z_APXZ3k9/s640/003.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh_5En6H4dp9gsMuMjCcrAmWeR7AN6hKUgO6u6XmptBMhs_ei2j6_YAQUWixa6naZk4Fo32qzSEgFL7_1xqzZ2NT1qKshLTMoT5mPMBo5N0xLcUPAG9RF7XVLvXCqPwitAxBeqWXH-YRSI5/s640/004.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgDEkfMntizt0hgyeIpzM87pVWBTjsWqF3S9tuxEEVyq3GnKu66nYOB-0lbqb07-FLfngweuuiH9k7MW74iaAej3K6MPJLmZ3022v90Hfz6Yg3LkCQUkemiq-nbRuC1B5XvxNNpFlr8lvoH/s640/005.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjwGgKu_aQO1qADjeuX36mHw8zJInif0FXKSNhUGxCckSd9K31k1B0KnVRZ1hs8NMncSeoGfeAwMsfSBEzjpe-gZ-IKEctMEOfUKRdeMRdhpxWVj4fC7D6qYSVEywPE89wch9cuwf1Rm_rz/s640/006.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhs8z2ykY_DLoLac0RLyiAPuXlzgDjVO5TexpIP_LIhBEyqI3QUccUiNOoOevt53W5kIQY35ytJS0E3QyCJPm9sXFESKBZSz19EV-Op8LS-71zPsGjPwUh4hULlNiLqt61LpWVbf48qTGfW/s640/007.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjTLl_Fwo3ICAfAiyGagJwYeZZuze4sNpIZcGMK3qFZJC9xo71gWRDcIQWVnQLoawFFpdLfgOLSZAb5h4u6Zbuv1thFM1CAm6ktzs0Ewe6BPTdM5MSDLFkUon7NmfM1QtPkccgjAyrcDJEG/s640/008.png)
記住我們只是建完Cluster而已,記得把ESXI主機拉進Cluster才算完成。
這時候客戶會先問一個問題?為什麼會有這兩行組態警告,
此主機目前沒有管理網路重複
此主機的 vSphere HA 活動訊號資料存放區數目為 1,其少於必要數目:2
要注意這只是警告,就算不處理 HA 還是可以正常運作。
因為HA他的目的就是在於知道對方主機發生故障之後,我再去幫他把VM的機器開機。
那我怎麼知道對方主機是活的還是死的?會不會只是剛好網路不通而已。
所以ESXI做了三件事情確認,
1.我們可不可以透過管理網路知道對方。
2.我們可不可以透過共用的儲存空間知道對方。
3.我們能不能到達Gateway知道是我的網路不通還是對方網路不通。
這是為什麼通常兩台硬體做HA或用心跳線直接串再一起,不透過交換器。
因此要有兩條以上的管理網路,或是兩個以上的儲存空間都是為了避免這點。
就像醫院為什麼所有網路設備都要兩個,就是其中一個故障我們還可以使用另一個出去。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjGbz6AqK7Cj1ya3SjpOXpsushfcO1NbmzY2fhYuWoMS8wxvXvkX38R6lBOT58kBa8QM4io43WVe9ZwVkk4nOp6HcwEvZhDvcnUZ8Ib0GKt2UT5J-OEAdKRp0pBrACrTSHRZFnnVkh6RZMl/s640/010.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgq2ZWvLDizglOWbpoJNeeB8AoHX2bSFqXmIBUwUVr0ypq3ozPrWHo-mv9G7T_VyLKNClxZmh3HskV3Vtfkv4fgnLGQPD3eRFku_LvzTGpPshLmCQhQ-Bpjcavfp8CatAhhT3uO1xQ_9kle/s640/011.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgbgZxv2kJeT_peppX8weJZi52tu2q5r58d2TotlKn9tbQEbCzGyMqquRTufOwBV60i_SGu0V7GM32h4eQF2qChaapZAqtGkicllPUB5Lp1E2ZnrBdwuSjbzr-r8Z41xKqWkCdWMfsewkMD/s640/012.png)
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgdYwKlfEXDPcmH0oUX2dJExIcabVZc5zIYwrOFEHrZCDQ1MbelCFc3bM2j7ogIqeZ0U5im9Hf5qppGPIGyMQvxuFM-zwIa8I-cTTgldC6fuOT5PuHPkhzvEOD36f3nAkFrY2n9sNEwx084/s640/99.png)
我們新增一片網卡插到switch上,然後把他都綁在原本的Vswitch上,因此我們就算隨便拔掉一張網卡,流量還是可以透過另外一張出去,兩台都要做。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhMXaX7fqmehVICGhOjOp3MCbMNpRJyDql_XOxlKggkyCkGTA7xIBQvutMmwS1WhNquTUc2ZWqaNYU9chkU_8Z5GaxHd_UJr3uNojiDMPeG25HPoZ7KSA5OcAmE95WRI8qYhEU-fevhxHdx/s640/013.png)
我們重新整理HA,確實 此主機目前沒有管理網路重複 警告消失了。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgGPSvgN6rIZOAnk29-UaDgXA4Nuipf73EVsyhC__DTxXnfgQ8I486pOC_JCG91U6SGDqaoXkYUE6tHcQJ-zCM07s1xtlcxZ6dl3kw5wHjJYB4uUMUKAG-Xr27Vi53I8HK1zTttM_m9lYT2/s640/15.png)
我們再把原本NFS的儲存空間掛給他,這時 此主機的 vSphere HA 活動訊號資料存放區數目為 1,其少於必要數目:2 重新整理HA之後,警告也消失了。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhozlwUPgGD241zlj02ZsbGASAJUh8YYxh-YZRXXER2dHYsSOVbA49dnIkXKfigngvdshJ5-gh2e8Zv6UCH93vclaIIbu0NQtwSUIdIzHNAm4FPZPKT-TR2CK4_icwdjEQfivBxBZ_b5eqy/s640/16.png)
目前這台主機是在開機狀態,而且是吃 Host 192.168.1.109的資源,他的儲存空間是在ISCSI,所以符合VMotion的條件
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi9f_8KP7g-NtYq-sVmZdIcGbNC_Mqpo8CYBdDqra1EWBqRK6uzJaPCgQQwQFS4FzzUmz2GZ0BTL7ccMJ5y_43gx3DKjGQ4ixLm9aZoTuBfZ1UjI2Mqx11vkxSEiNHDs38Xn6kAxbsOLmrr/s640/17.png)
我們把109主機電源拔掉,過了一會兒當114發現跟109主機的心跳線死掉,他就會嘗試去開啟原本在109主機上的VM,這時候要特別注意,虛擬機是被拔電源的狀態下,被另一台ESXI強制重開,所以原本記憶體的東西會消失,虛擬機會顯示不正常開機,這時候如果你的服務沒有設定開機後自動啟用,還是會造成服務問題,正常來說如果你是Linux,有一個apache設成開機服務自動啟用,這樣服務中斷時間大約等於重開機時間。
另外可以VMotion是可以HA的"必要條件",如果你還有掛local hd的光碟映像檔,或是主機位置就是放在local hd,另一台主機一樣開不起來。
我有錄了一段HA的影片請參考這邊:
https://www.youtube.com/watch?v=siiWhTq28_k
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhk55fDUgMBzRhTaxEFNAgePaK18jZz4Gh2Jo1Cu-3T2QvE5hpwnKzZHGA5-NxsQLDpWXXo_2yv0Y1e4T6lLDkZ5sqVo1-wzgN5AR26vrPtqE95DjVlaDVWuDnNCsDGjK0fYps1OFnwl8Kr/s640/002.png)
最後再提一點,HA的許可控制,什麼是許可控制?
想像一下如果我們有30個人要坐遊覽車出遊,每台車可以載30人,我們有兩台車,可以選擇兩台車各載15人,但是老闆覺得這樣太浪費空間了,所以再找另一團30人上車,但是其中一台車故障的話,如果只是各載15人,可以全部擠到另一台車,大家還是可以繼續旅遊,可是當你各載30人的話,當一台車故障的時候,另一台車就沒有空間載人了。
HA也是如此,如果你不事先預留資源的話,你把所有資源都吃滿,到時候有一台主機出事的話,其他台也沒有資源可以接手開虛擬機,因此許可控制就是事先預留資源,誰也不能使用,然後等一台主機掛的時候,其他台虛擬機才有保留的資源開機。
所以如果你只有兩台ESXI,當你開啟此功能時,你就會發現,你所有可使用的資源包含CPU、記憶體就只剩下一半可以使用,因為要確保一台死掉,另一台可以開啟所有虛擬機。
當然你也可以選擇停用,就是不保留,反正就遊覽車超載擠一擠出事再說,這也是台灣老闆最愛的作法。
結論:
VMotion是HA的必要條件,如果HA無法成功的話要先檢查VMotion的條件是否成立,另外雖然HA的設定很簡單,只有五分鐘就可以設完,但是其中資源的調配還有HA心跳線都是相當重要需要注意的地方,不然有可能產生大腦分離,就是兩台主機都認為對方故障,都想去開虛擬機,另外HA只是把對方虛擬機強制重開機,所以重開機當下的記憶體如果有包含交易資料也會消失,如果要解決的話需要使用FT,重開機的當下如果你的服務沒有設成開機自動啟到,也會造成服務中斷。
留言
張貼留言