Fujitsu RaidManager mit ESXi LSI Plugin

Feb 10 2018

Wir haben leider fast täglich das Problem, dass unser Fujitsu RaidManager nicht mehr mit den LSI CIM Provider auf den ESXi Hosts sprechen mag. In diesem Fall werden wir auch nicht per SNMP Trap bzw. Mail verständigt, wenn eine Platte kaputt ist, oder der RaidController ein Problem hat.

Das sieht dann so aus:

 


In einer ruhigen Viertelstunde, ja sowas gibt´s noch in der IT, hab ich mir mal die Logfiles vom RaidManager angesehen.
Und siehe da, in der Datei  "snapshot.xml" bin ich auf fogende Zeile gestoßen:
...

Status="Warning" Additionalstatus="Could not connect to server"
...

Also hab ich schnell mal einen 3 Zeiler in Powershell gebastelt, welcher innerhalb der "snapshot.xml" nach der o.a. Fehlermeldung sucht, und bei einem Fund den betroffenen Hostnamen ausgibt.
Damit kann ich dann das Service "sfcbd-watchdog" auf dem Host durchstarten und somit funktioniert (meistens) auch wieder die Kommunikation zwischen RaidManager und LSI CIM Provider. :)

Ich hab dann das Script noch um ein paar Funktionen wie Logfile schreiben, Mail senden wenn Host gefunden wurden, etc. erweitert.

2018-02-10 07:00:12 [I] ScriptName: Get-SRMraidlog.ps1 ScriptVersion: 0.7
2018-02-10 07:00:12 [I] log retension in days . . . : 7
2018-02-10 07:00:12  
2018-02-10 07:00:12 [I] check if script is already running
2018-02-10 07:00:12 [I] (PID=[3076]) This is the 1st and only instance allowed to run
2018-02-10 07:00:12 [I] check if snapshot.xml exists and is accessible
2018-02-10 07:00:12 [I] yes it is ;)
2018-02-10 07:00:12 [W] Found problematic Hosts...
2018-02-10 07:00:12 [I] connect to vcenter 1
2018-02-10 07:00:16 [I] connect to vcenter 2
2018-02-10 07:00:18 [I] connect to vcenter 3
2018-02-10 07:00:20 [I] check if host xyz is online
2018-02-10 07:00:21 [I] host xyz is online
2018-02-10 07:00:21 [I] restarting sfcbd-watchdog on host xyz
2018-02-10 07:00:27 [I] wait 15 seconds and check if sfcbd-watchdog is running
2018-02-10 07:00:43 [I] sfcbd-watchdog is running
2018-02-10 07:00:43 [I] disconnect from vCenter
2018-02-10 07:00:43 [I] disconnect vcenter 1
2018-02-10 07:00:43 [I] disconnect vcenter 2
2018-02-10 07:00:43 [I] disconnect vcenter 3
2018-02-10 07:00:43 [I] no old  files found to cleanup
2018-02-10 07:00:43 [I] send Mail to abc@def.at

Das Script läuft nun täglich gegen 6:30 und findet immer wieder Hosts. ;)