Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

El script cuenta con consultas SNMPv1, SNMPv2 o SNMPv3 y al final muestra un tip para que el operador consulte al administrador en caso de que el equipo tenga problemas en la respuesta.

TSWImage Modified

TSWImage Modified

6. Update
 nodes

...

Al final, estos dos archivos deberán ser adjuntados al mail enviado al Soporte de Opmantek para su análisis.

...

4. Smart Diagnostic

Permite ejecutar pruebas inteligentes de forma automática todas las pruebas contenidas en el script con solo acceder a la opción correspondiente.

Al final, que le permitirán al operador revisar de forma rápida el estado del servidor y diagnosticar si hay algún problema o encontrar detalles que se puedan corregir a tiempo para evitarlo.

Show version of RRD/mongo


Zombies checkup


Primer borrador

Análisis de causas

En este apartado se realizará la evaluación de todas los posibles motivos que llevaron a que la incidencia ocurriera según reporta el cliente en cuestión, revisando cada uno de los parámetros de importancia del servidor, desde archivos de configuración importantes, pasando por hardware, software y, de ser necesario, revisión a fondo de los nodos involucrados.

Es importante que el cliente envíe un NMIS Support Tool y/o un OMK Support Tool desde el inicio, esto para tener una copia de los archivos de configuración más importantes en el momento del reporte de la incidencia.

2.1. Análisis de Support Tool

Dependiendo del escenario, comenzaremos revisando los archivos importantes contenidos en el Support Tool, se mencionan algunos de ellos a continuación:

  • Carpeta conf: Config.nmis, Nodes.nmis, Users.nmis
  • Carpeta logs: error_log, event.log, nmis.log.
  • Carpeta models: revisar si hubo algún cambio reciente que pudiera afectar.
  • Carpeta system_status: cpuinfo, disk_info, iostat, meminfo, top.
  • Carpeta system_status/apache: revisar los archivos de configuración.
  • Carpeta system_status/cron: revisar si el crontab contiene algún comando que pueda crear conflicto con otro cron.
  • Carpeta system_status/cron.d: revisar si no hay un cron duplicado y que al menos el cron de nmis esté configurado de manera correcta.

NMIS Support ToolImage Removed

2.2. Análisis de cambio de configuraciones

En este análisis nos servirá de mucha ayuda el Support Tool enviado por el cliente, ya que podremos darnos cuenta si algún archivo de configuración fue modificado en los últimos días.

De igual forma, debemos tener acceso al servidor en cuestión, para poder verificar si se hizo algún backup y así poder restablecer el archivo a los parámetros anteriores.

Las principales carpetas a revisar son:

  • /usr/local/nmis8/conf
  • /usr/local/omk/conf
  • /etc/cron.d

2.4. Análisis de nodos

En este punto, se ejecutará un análisis a fondo de los nodos en los cuales se haya detectado algún problema durante el momento de la incidencia.

Se recomienda revisar las siguientes gráficas en NMIS:

  • Gráfica de KPIs

KPIsImage Removed

  • Gráfica de Reachability, Availability and Health

Reachability, Availability and HealthImage Removed

  • Gráfica de Response Time

Response TimeImage Removed

  • Gráfica de IP Utilisation

IP UtilisationImage Removed

De igual forma, se recomienda realizar búsquedas mediante un ps -fea | grep nombredenodo de los nombres de los nodos en las carpetas:

  • /usr/local/nmis8/logs
  • /usr/local/omk/logs

Esto con la finalidad de encontrar detalles que pudieron afectar los collects y/o los updates de los nodos, o algún tema en los módulos que impliquen lo

3. Análisis de resultados

En

4. Conclusiones y recomendaciones

Ense genera un archivo .tar.gz que deberá ser adjuntado por el operador si se abre un ticket de Soporte, como se menciona en el tip.

TSWImage Added

5. Create System Backup File

Realiza una copia de seguridad de los directorios de configuración para conservar todos los ajustes realizados por el cliente.

Debe señalarse la carpeta en la cual se va a realizar este respaldo, en este ejemplo utilizamos /tmp y el script comenzará a ejecutarlo.

El programa muestra el árbol de las carpetas y archivos respaldados y el nombre del archivo .tar.gz generado.

TSWImage Added

6. Execute Support Automation Tool

Permite ejecutar la herramienta de soporte de NMIS y los módulos, la cual recopila toda la información relevante sobre el estado y la configuración del servidor en 2 archivos:

  • nmis-support.zip
  • omk-support.zip

Al final, estos dos archivos deberán ser adjuntados al mail enviado al Soporte de Opmantek para su análisis.