Proxmox Node Status “Unknown” Problemi

Problem Tanımı

Proxmox cluster ortamında bazı node’lar GUI üzerinde “Unknown” durumuna düşebilir. Bu durumda:

  • Node çalışıyor olabilir (SSH erişilebilir)
  • HA aktif görünür
  • Ancak GUI ve API tarafında node health okunamaz

Aşağıdaki gibi görünür:

Root Cause (En Yaygın Sebep)

Bu durum genellikle:

  • pvestatd servisinin kilitlenmesi
  • PID lock dosyasının bozulması
  • Servisin zombie durumda kalması

nedenleriyle oluşur.

Troubleshooting Adımları

1️⃣ Servis Loglarını Kontrol Et

journalctl -xeu pvestatd.service

Bakılacak şeyler:

  • timeout
  • lock hataları
  • stuck process

2️⃣ Process Kontrolü

ps aux | grep pvestatd
Hiç yokservis down
Var ama stuckkill gerekir

3️⃣ Port / File Lock Kontrolü

lsof | grep pvestatd

veya

fuser /var/run/pvestatd.pid.lock

Burada PID lock kullanan process varsa problem buradadır.

Çözüm (Restart ATMADAN)

1️⃣ Problemli Process’i Öldür

kill -9 <PID>

2️⃣ Servisi Yeniden Başlat

systemctl restart pvestatd

3️⃣ Durumu Kontrol Et

systemctl status pvestatd

ve GUI’den node durumunu kontrol et.

✅ Beklenen Sonuç

  • Node status → Online
  • Question mark → kaybolur
  • Metrics → tekrar akmaya başlar

Sonuç

Bu problem reboot atmadan %95 çözülür ve Proxmox ortamlarında oldukça yaygındır.
Özellikle büyük cluster ortamlarda daha sık görülür.

Bir sonraki yazımızda görüşmek üzere. Faydalı olması dileğiyle.