6、允许的故障数量、副本数和需要的主机之间的关系
允许的故障数量(n) | RAID-1副本数(n+1) | VSAN群集中需要的主机数量(2n+1) |
---|---|---|
1 | 2 | 3 |
2 | 3 | 5 |
3 | 4 | 7 |
4 | 5 | 9 |
如果试图设置的允许的故障数量值大于VSAN群集的能力,这是不允许的,设置不会成功。
7、允许故障的最佳实践
允许的故障数的推荐值是1,除非你有特别强的可用性要求虚拟机可以承受超过1个主机的故障。注意,增加允许的故障数量会要求额外的磁盘可用容量,用于创建额外的副本。
VSAN有多重管理流程来警告和提高保护,以免意外移除主机造成VSAN无法满足指定的虚拟机对允许故障数的要求。
(1)从支持的角度来书,答案是3。要满足允许故障数为1的策略,任何时候都需要最少3台主机,即使一台主机发送故障,你的数据仍然可以访问。因为3台主机具有2个镜像副本和一个见证。
8、策略设置,条带宽度
默认的条带宽度最大值可以被设定为12。
可以跨同一主机上的多个磁盘,也可以跨主机。
在定义磁盘条带宽(SW)和FTT时,只是需要有SWxFTT个磁盘才能满足策略的要求。
条带带宽使用的分段大小是1MB。当1MB的条带分段1会存入一台ESXI主机,下一条会写入另外一台ESXI主机。
9、条带宽度的最佳实践
VSAN具有很多自有的逻辑来智能的处理对像放置,建议不要去增加条带宽度,除非你已经明确找到了(通过可由增加条带宽度解决的)严重的性能问题。例如读缓冲不能命中或者磁盘回写的性能问题。
10、如何查看虚拟机交换文件的存储对象
虚拟机交换文件是组成虚拟机的对象之一,其他的对象还有虚拟机的主页名字空间、VMDK和快照增量。不不幸的是你在VSAN中,无法从用户界面的虚拟机对象列表中看到虚拟机的交换文件。这不可避免的引发了下面的问题:如何检查和验证虚拟机交换文件对象的策略及消耗掉的资源?
使用RVC命令行--vsan.vm_object_info,你也只能得到关于巡检主页名字空间、VMDK和快照增量的信息,虚拟机交换文件信息再一次遁形了。要获得虚拟机交换文件信息,首先必须从虚拟机交换文件的描述文件(description file)中获取UUID信息。要做到这点,可使用esxi的命令行,使用cat命令显示虚拟机交换文件的描述文件的内容,并找到objectID这一项:
#cat win-xp1.vswp
#Object DescriptionFile
11、从故障中恢复
(1)根据估值类型的不同(网络、硬件或者其他),受影响的组建会被标示为“absent”(失联)。一旦VSAN失联,就开始启动一个60分钟的计时器。如果组建在60分钟内恢复,VSAN会同步副本。如果没有恢复,VSAN会创建一个新副本。
(2)这个超时值可以再高级设置中修改,方法是在每台ESXi主机的高级设置区,更改VSAN.ClomRepairDelay参数。
(3)如果修改此参数必须保持所有ESXi主机上保持相同。
(4)在某些场合下VSAN会对故障立刻做出反应。则取决于故障类型--例如磁盘或者闪存设备故障。很多情况下,控制器或者设备本身能够支出发生了什么故障,并会告诉VSAN设备(故障)不太可能很快(在一个合理的时间)恢复,于是VSAN会立刻响应,吧所有受影响的组建标注为“degraded”(已降级),并立刻创建一个新的镜像拷贝。
(5)当然,在创建镜像之前VSAN会验证是否有足够的空间来存放这个新的拷贝。如果故障在60分钟内恢复,或者在还未完成副本的创建之前就恢复了,VSAN会决定是完成副本创建更好还是同步“旧”组建更合理。这取决于一个概念--重新配置(reconfiguration)。
(6)重新配置可能是最消耗资源的任务,因为在大多数情况下都会产生大量的数据转。为了保证普通的虚拟机I/O不会被重新配置任务影响,VSAN具有这样的能力:把重新配置任务(对资源的请求)限制在一定的范围内,从而不影响虚拟机的性能。
12、VSAN中HA
(1)VMware建议在VSAN中的vSphere HA要使用VSAN网络中的IP地址来做隔离检测。要vSphere HA不使用默认网关而使用VSAN中的一IP地址来做隔离检测,需要在vSphere HA的高级设置中:
das.useDefaultIsolationAddress=false
das.isolationAddress0=
(2)vSphere HA高级配置的更多细节可以参考KB2033250
(3)如果在VSAN层面对VSAN网络进行了变更,这无法被vSphere HA自动侦测到。因此,vSphere管理员必须手动发起一次vSphere HA群集重新配置以使这些变更生效。
(4)关于VSAN上的vSphere HA,不同点是VSAN数据存储无法用作心跳数据存储。vSphere HA不将VSAN数据存储作为心跳存储,也不允许用户将其设定为心跳存储。VSAN使用网络上群集服务(clustering service)进行快速的故障侦测。如果存在共享存储,这些传统数据存储会被用于系统存储。
(5)vSphere HA需要为群集中的每台虚拟机保存其保护元数据。在传统数据存储上,这是保存在每个数据存储的根目录下取名为.vSphere-HA。在VSAN中,vSphere HA保护信息不是保存在存储的根目录下,而是保存在虚拟机的名字空间元数据中,和虚拟机的那组常用配置文件存放在一起。
(6)vSPhere HA和VSAN之间互操作性还有一个重要的因素需要注意。在配置vSphere HA时,有一个需要做出的决定就是关于接入控制。接入控制保证了vSPhere HA可以流出一些资源,这样在故障时能具有足够的资源可以重启启动虚拟机。
注意,在故障恢复时,VSAN是不知道有接入控制机制存在的,VSAN不存在这样的自动机制来预留。
(7)vSPhere HA的VSAN环境中发生主机隔离事件时,vSPhere HA会实施配置的隔离响应举措。推荐配置为让vSPhere HA自动关闭主机上的虚拟机电源,因此,“隔离响应”应设定为“请关闭电源,然后进行故障切换”。(注意:关闭电源相当于直接拔掉主机电源,硬关机。)