ESXI HOST 'NOT RESPONDING' SORUN GİDERME REHBERİ
vCenter'da Host bağlantısının kesilmesi (Not Responding) hatasının temel nedenleri, tanı yöntemleri ve yönetim servislerini yeniden başlatarak acil durum çözümü.
ACİL DURUM KILAVUZU: 'Not Responding' durumu, Cluster özelliklerinin (HA, DRS) çalışmasını engeller. Bu durumdaki bir Host'un VM'leri korunmasız kalır. Sorunun nedeni hızla tespit edilmeli ve çözülmelidir.
Bölüm 1: Tanı ve Olası Nedenlerin Belirlenmesi
Sorun Giderme Ön Kontrol Listesi
- Ağ Bağlantısı (Temel):
Problem yaşayan Host'un Management IP adresine vCenter sunucusu üzerinden ve yerel yönetim makinenizden **ping** atın. Eğer ping gelmiyorsa sorun %90 ağ katmanındadır (Kablo, Switch Portu, VLAN).
- Management Servis Kontrolü:
Host'a doğrudan Web Client (tarayıcı) veya SSH üzerinden erişmeyi deneyin. Eğer ping gelmesine rağmen erişim başarısız olursa, sorun Host'un kendi içindeki yönetim servislerindedir.
- Kaynak Tüketimi (Yüksek Yük):
Host'un DCUI (Direct Console User Interface) konsoluna gidin (F2). System Customization > Troubleshooting Options menüsünden veya Ana ekranda **top** komutu ile (SSH üzerinden) CPU/RAM kullanımını kontrol edin. %99-100 kaynak kullanımı, Agent'ların cevap vermemesine neden olabilir.
- Depolama Erişim Kontrolü:
Host'un, VM'lerin bulunduğu Datastore'lara erişiminin kesilip kesilmediğini kontrol edin. Eğer tüm Datastore'lar görünmezse, vCenter iletişimi kesilmez ancak VM'ler erişilemez duruma gelebilir.
Bölüm 2: Management Agent'ları Yeniden Başlatma (DCUI Yöntemi)
Ping ile erişilebilen ancak web arayüzü ve vCenter'a cevap vermeyen Host'lar için en yaygın ve hızlı çözüm, yönetim servislerini (Agent'ları) yeniden başlatmaktır. Bu işlem, VM'lerin çalışmasını etkilemez ancak vCenter ile bağlantıyı geçici olarak keser.
Adım Adım Agent Yeniden Başlatma
- DCUI Erişimi: Fiziksel sunucu konsoluna veya iLO/iDRAC gibi uzak yönetim konsoluna erişin. **F2** tuşuna basarak Root parolanızla DCUI'ye giriş yapın.
- Sorun Giderme Menüsü: Menüde **Troubleshooting Options** (Sorun Giderme Seçenekleri) seçeneğine gidin.
- Agent'ları Yeniden Başlatma:
- Önce **Restart Management Agents** seçeneğini seçin.
- Sistem,
hostd ve vpxa olmak üzere iki temel Agent'ı yeniden başlatmayı isteyecektir. Onaylayın (F11).
Bu işlem yaklaşık 1-3 dakika sürer. Bu süre zarfında Host, vCenter'da **Disconnected** (Bağlantı Kesildi) durumuna geçebilir ve ardından otomatik olarak **Connected** (Bağlandı) durumuna dönmelidir.
- Hizmetleri Kontrol Etme: Yeniden başlatma işlemi bittikten sonra, Host'un web arayüzüne (tarayıcı) erişiminizi ve vCenter'daki bağlantı durumunu kontrol edin.
Bölüm 3: SSH Üzerinden Servis Yeniden Başlatma (Gelişmiş)
Eğer Host'a SSH erişiminiz varsa, servislere daha spesifik komutlarla müdahale edebilirsiniz.
SSH Komutları
- SSH Bağlantısı: Bir SSH istemcisi (Putty, TeraTerm) kullanarak Host'a Root kullanıcısıyla bağlanın.
- Servisleri Kontrol Etme: Servislerin durumunu kontrol edin:
/etc/init.d/hostd status
/etc/init.d/vpxa status
Eğer durumları 'running' (çalışıyor) yerine 'stopped' veya 'dead' ise, yeniden başlatma gereklidir.
- Agent'ları Yeniden Başlatma Komutu: Hem
hostd (ESXi Host Servis Agent'ı) hem de vpxa (vCenter Agent'ı) servislerini tek bir komutla yeniden başlatın:
services.sh restart
Bu komut, Agent'ları yeniden başlatır ve genellikle Host'un vCenter'a geri dönmesi için yeterlidir.
- Host Bağlantısı: Komut bittikten sonra SSH bağlantısını kesin ve vCenter'ın Host'u yeniden **Connected** olarak işaretlemesini bekleyin.
Kalıcı Çözüm: Agent'ları yeniden başlatmak geçici bir çözümdür. Sorunun tekrarlanması durumunda, Host'un log dosyaları (/var/log/hostd.log ve /var/log/vpxa.log) incelenmeli, Host'un zaman senkronizasyonu (NTP) ve DNS çözünürlüğü (Management Network IP'si için) kontrol edilmelidir.
SONRAKİ DÖKÜMAN: FORTIGATE VM KURULUMU >>