一、日志收集
1、收集Esxi日志
在 ESXi Shell 上运行以下脚本,生成的文件具有以下格式: esx-date-unique-xnumber.tgz。
/usr/bin/vm-support
2、收集 vSphere 日志文件
(1)在 vSphere Client 菜单中,选择系统管理 > 部署 > 系统配置。
(2)选择一个 vCenter Server 节点,然后单击导出支持包。
(3)选择支持包类型:
- 完整支持包:包含有关所有服务的信息。
- 最小支持包:包含基本产品和配置信息。
- 自定义支持包:包含自定义信息。选择任意清单属性以下载相应的日志文件。
(4)单击导出。
(5)(可选) 也可以使用另一种方法下载 vCenter 日志包:
a、右键单击 vCenter Server 实例,然后单击操作 > 导出系统日志...。
b、单击选择主机将选定主机日志放入导出包中。选中包括 vCenter Server 和 vSphere UI 客户端日志,以选择将 vCenter Server 和 vSphere UI 日志包含在包中。单击下一步。
c、单击选择日志以选择要导出的特定系统日志。单击导出日志。
二、查看日志收集时间
日志收集时间在commandsdate.txt文件中。
收到vm support日志后第一件事就是确认日志的收集时间是否包含故障发生时间,如果没有包含日志已经没分析的必要了。
三、查看Vmware版本信息
确认VMware ESXi系统的版本与服务器的版本的兼容性,VMware ESXi系统的版本在commandsvmware_-vl.txt中查询。
示例如下:
VMware ESXi 5.5.0 build-2068190
VMware ESXi 5.5.0 Update 2
四、查看重启关机记录
查看vmksummary日志,vmksummary会记录所有OS的重启关机记录,正常运行时每一个小时记录一次心跳,通过它可以对EXSi主机的运行情况有一个大概的了解。
vmksummary日志在varrunlogvmksummary.log文件中,如下图所示:
更多关于vmksummary的介绍,请参考VMware官方KB:
Format of the ESXi 5.x vmksummary log file (2004566)
五、确认BIOS时间和OS操作系统时间差
vm-support日志中的异常记录,通常需要结合BMC日志查看硬件是否异常。由于服务器的BMC时间和OS时间是两套时钟源,且用户在设置时区时可能会有所差异,在问题分析前,确认BMC时间和OS时间的时差就显得尤为重要。
确认BMC时间和OS时间的时差,需要结合查看重启关机记录的vmksummary日志和BIOS sel日志,sle日志在BIOS一键收集日志中AppDumpsensor_alarmsel_current.csv。确认方法如下:
1、在vmksummary日志中查找到一次重启的记录,如“2015-11-19T09:14:46Z bootstop: Host is rebooting”,记录下OS重启的时间。
2、在BIOS sel日志中,查找到该时间前后的重启记录,如“SysRestart","System Restart Unknown”,记录下两者之间的差异。
3、再次查找2~3个vmksummary和sel日志的重启或者关机时间进行确认,如果时差是固定的话基本可以确认BMC时间和OS时间的时差。
参考文档:
https://docs.vmware.com/cn/VMware-vSphere/7.0/com.vmware.vsphere.monitoring.doc/GUID-0A79DA83-FA9D-4765-8DF2-F4B276E7C912.html
https://kb.vmware.com/s/article/2004566