vCLS Helper VM lässt sich nicht mehr einschalten

Okt 19 2023

Das erste Mal Probleme mit den vCLS Helper VMs, in dem Fall konnte diese nicht mehr vom vCenter gestartet werden.
Die Fehlermeldungen im vCenter, ja gleich mehrere, schauten so aus:
Cluster Agent VM vCLS-84397c77-453e-4ae5-aa32-4dc039c03ac8 on cluster XXX has an invalid configuration (vCLS)
Error message on vCLS-84397c77-453e-4ae5-aa32-4dc039c03ac8 on esxXXX : An error occurred while opening configuration file
An error message listing a collection of observations has been reported by the virtual machine

Die Befragung der Suchmaschine hat mich nicht zu einem Ergebnis gebracht, was aber an den Suchparametern lag. Also mal kurz das TAM Orakel befragt und schon war der erste KB offen.

How to Disable vCLS on a Cluster via Retreat Mode

Gelesen und gleich getan, leider natürlich gleich einen Fehler gemacht, und das bei copy / paste.
Ganz wichtig daher:

Therefore please be careful to only use the ID domain-c<number>

Also die Cluster ID nur bis zum Doppelpunkt kopieren, nicht die ganze URL!
Danach ein neues Advanced Setting im vCenter mit der Cluster ID anlegen und die Value auf "false" setzen (Groß/Kleinschreibung ist beim Wert egal).
Sobald dieses Advanced Setting aktiv wird, dauert zirka eine Minute, werden alle vCLS VMs vom Cluster abgebaut. In meinem Fall war die eine, die sich nicht mehr starten lies dann "orphaned" und konnte auch nicht aus dem Inventory gelöscht werden. 
Da ich aber beim ersten Versuch einen falschen Namen in den AdvSettings eingetragen hatte und sich damit der zweite Wert nicht mehr auf "true" setzen lies, musste ich über die Shell die vpxd.cfg bearbeiten.

Zuerst mal eine Kopie der Datei vpxd.cfg anlegen, sicher ist sicher.


cp etc/vmware-vpx/vpxd.cfg etc/vmware-vpxd/vpxd.cfg.bak

Danach das vpxd Service stoppen 

service-control --stop vmware-vpxd

Nun alle Einträge mit vcls wie im KB beschrieben entfernen

sed '/<vcls>/,/<\/vcls>/d' -i /etc/vmware-vpx/vpxd.cfg

Und das Service wieder starten

service-control --start vmware-vpxd

Damit war dann auch die orphaned vCSL VM weg. ;)