Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Siempre será importante basarnos en el load average y en el %CPU, ya que si estos valores son altos, tendremos seguramente un problema en algún o algunos procesos que se están ejecutando actualmente.

topImage RemovedtopImage Added


2.3.2. Velocidad de lectura y escritura de discos

Con este análisis, podremos darnos cuenta si existe una falla física en los discos del servidor. Si nos damos cuenta de que hay un problema, hay que notificarlo inmediatamente al cliente.

Basta con ejecutar un par de comandos:

...

  • 0.0X s, parámetros correctos.
  • 0.X s, hay una advertencia (y podría generar un problema).
  • X.0 s, es crítico (y existe un problema).

Image RemovedImage Added


2.3.3. Comando iostat

Se usa para monitorear la carga IO del equipo del sistema. Si se tiene un alto %util, es muy probable que exista un problema que pueda llevar incluso a la pérdida de datos. Esto hay que notificarlo inmediatamente al cliente.

Se recomienda ejecutar el comando como sigue, para tener 5 pruebas del mismo:

  • iostat -xtc 3 5

EniostatImage Added

2.3.4. Revisión de filesystems

...

Se revisa el espacio en cada uno de los filesystems del sistema, esto para comprobar que la incidencia no se esté presentando por una falta de espacio en el servidor.

Se ejecutaa el comando como sigue:

  • df -h

df -hImage Added

2.3.5. Revisión de demonios

Se ejecuta una revisión de cada uno de los demonios del sistema, para comprobar que todos los esenciales se estén ejecutando de manera correcta.

Principalmente, deben revisarse los que se mencionan a continuación:

  • service omkd status
  • service nmisd status (si aplica)
  • service nmis9d status (si aplica)
  • service mongod status
  • service opchartsd status
  • service opeventsd status
  • service opconfigd status
  • service crond status
  • service httpd status

service statusImage Added
De igual forma, puede ejecutarse el siguiente comando para revisar todos los servicios en ejecución (CentOS 6):

  • service --status-all

service --status-allImage Added
En caso de que se detecte que algún servicio está down, debe reiniciarse con el siguiente comando:

  • service demoniod restart

Si persiste el down, deberá revisarse el log de dicho demonio y analizarse para ver qué está sucediendo. Se recomienda revisar en la página https://support.opmantek.com/secure/Dashboard.jspa si existe algún ticket con el mismo error para de ahí encontrar alguna solución.

2.4. Análisis de nodos

En

3. Análisis de resultados

...