Esta página está destinada a proporcionar información de la instalción y uso del Troubleshooting Wizard, que tiene como objetivo ayudar a los clientes a ejecutar un diagnóstico completo de su(s) servidor(es) para determinar la causa raíz de algún probable problema que se esté presentando.

Abarcaremos desde la descarga e implementación del archivo de Troubleshooting, pasando por el análisis completo del servidor utilizando cada uno de los menús interactivos del programa.

Este documento está basado en las pruebas mencionadas en la página Proceso de resolución de problemas de dispositivos en NMIS.

Descripción del problema

Para poder ejecutar el Troubleshooting Wizard, debemos tener una descripción muy bien detallada por parte del cliente que nos dé un buen panorama de la situación que está presentando.

Para esto, debemos resolver algunas preguntas importantes:

a) Descripción de la incidencia: ¿qué está sucediendo? ¿desde cuándo?

b) ¿En qué servidor o servidores se está presentando la incidencia?

c) Descripción del servidor o servidores en los que se está presentando la incidencia

We will cover from the download and implementation of the Troubleshooting file, going through the complete analysis of the server using each of the interactive menus of the program.

This document is based on the tests mentioned on the NMIS Device Troubleshooting Process page.

Problem description

In order to run the Troubleshooting Wizard, we must have a very detailed description from the client that gives us a good overview of the situation that it is presenting.

For this, we must solve some important questions:

a) Incident description: what is happening? since when?

b) On which server or servers is the incident occurring?

c) Description of the server or servers in which the incident is occurring: CPUs, RAM, DD, total nodes.

d) ¿En que nodo o nodos se está presentando la incidencia

e) Detalles adicionales, por ejemplo: configuración actual de cron de NMIS por lo menos, configuración actual del archivo /etc/mongod.conf, configuración de parámetros de base de datos en /usr/local/omk/conf/opCommon.nmis, si se modificó algún archivo recientemente, si alguna configuración realizada ya sea en el servidor o en los equipos provocó la incidencia

Troubleshooting Wizard:


Install and run

The script installation file ( and the two complementary scripts for its execution ( and, can be downloaded from the following GitHub link: TS_Wizard_NMIS8_OPMANTEK.

Debe descargarse y subirse al servidor en el cual se quiera realizar el análisis mediante un cliente FTP (como FileZilla), a la carpeta deseada por el cliente.

Una vez que ya se tenga el archivo en el servidor, lo ejecutamos con el comando: All three must be uploaded to the same folder on the server where the analysis will be performed using an FTP client (such as FileZilla).

Once the three files are already on the server, it must be executed with the command:

Once the three files are already on the server, it must be executed with the command: sh


Una vez que hayamos ejecutado el archivo, accederemos a la pantalla inicial, donde se muestran los detalles del Sistema Operativo, como es la versión de Linux y un pequeño resumen de la memoria y CPU del sistema.

De igual forma, se muestra el Menú Principal, donde encontraremos las diferentes opciones a las que podemos acceder:


Once we have executed the file, we will access the initial screen, where the details of the Operating System are shown, such as the version of Linux and a small summary of the memory and CPU of the system.

In the same way, the Main Menu is shown, where we will find the different options that we can access:

  1. Execute Healthcheck: we can perform a complete review of the server.
  2. NMIS Configuration Consistency: we will be able to review the consistency of the most important NMIS configuration files.
  3. Nodes Troubleshooter: we will be able to review the behavior of the nodes added to NMIS.
  4. Smart Diagnostic: creates a full system diagnostic in a .tar.gz file, which can be attached in case a ticket needs to be opened with Opmantek Support
  5. Create System Backup File: creates a .tar.gz file that will contain a backup of the /etc/* and /usr/local/* folders.
  6. Execute Support Automation Tool: genera un archivo de soporte de NMIS y uno de OMK, los cuales podrán adjuntarse en caso de que se requiera abrir un ticket con el Soporte de Opmantek

Troubleshooting Wizard:



1. Execute Healthcheck

Se puede elegir entre diferentes opciones, las cuales se muestran a continuación


1. TOP

Este comando nos da información de todos los procesos que se están ejecutando en este momento en el servidor y el porcentaje de utilización de CPU y memoria RAM.

Siempre será importante basarnos en el load average y en el %CPU, ya que si estos valores son altos, tendremos seguramente un problema en algún o algunos procesos que se están ejecutando actualmente.

Al final de la ejecución del comando, nos muestra una serie de tips, como son:


This command gives us information on all the processes that are currently running on the server and the percentage of CPU and RAM memory utilization.

It will always be important to base ourselves on the load average and the %CPU, since if these values ​​are high, we will surely have a problem in one or more processes that are currently running.

At the end of the execution of the command, it shows us a series of tips, such as:

  • Check disk partitions.
  • Clean registry files that take up too much space.
  • Delete cache.


2. System date and time

Es muy importante que el servidor tenga configurada de forma correcta la fecha y hora, según la zona horaria de cada cliente; esto debido a que hay muchos procesos que se ejecutan en lapsos específicos de tiempo y, de igual forma, los logs del sistema y los registros de modificación de archivos, contienen marcas de tiempo para poder detectarse en caso de un error.

Es por eso que se incluye este apartado para que el operador sepa que la fecha y hora del sistema son adecuadas. Al final, en caso de que el servidor no tenga un NTP activado, se muestra un tip para contactar al administrador del sistema y verificarlo

That is why this section is included so that the operator knows that the system date and time are adequate. At the end, in case the server does not have NTP activated, a tip is displayed to contact the system administrator and verify it.


3. Disk R/W

Con este análisis, podremos darnos cuenta si existe una falla física en los discos del servidor.

Con este análisis, podremos darnos cuenta si existe una falla física en los discos del servidor.

El programa ejecuta los comandos

The program executes the commands:

  • dd if=/dev/zero of=/data/omkTestFile bs=10M count=1 oflag=direct
  • dd if=/data/omkTestFile of=/dev/null 2>&1

Y después, muestra la salida, que se tiene que comparar con los valores

  • 0.0X s, parámetros correctoscorrect parameters.
  • 0.X s, hay una advertencia (y podría generar un problemathere is a warning (and could cause a problem).
  • X.0 s, es crítico (y existe un problemait is critical (and there is a problem).

De igual forma, se ejecuta un iostat -x 5 4, que se usa para monitorear la carga IO del equipo del sistema. Si se tiene un alto %util, es muy probable que exista un problema que pueda llevar incluso a la pérdida de datos, lo cual se señala al final de la ejecución del comando


4. Filesystem

Muestra un análisis detallado del espacio en cada uno de los filesystems del sistema, esto para comprobar que la posible incidencia no se esté presentando por una falta de espacio en el servidor. También muestra un tip de que si el uso es +85% en alguno de los ficheros, se contacte al administrador para que se puedan depurar.

De igual forma, ejecuta un comando para saber la utilización de la memoria RAM y swap del sistema, mostrando un tip si se tiene un alto porcentaje de utilización para contactar al administrador y ver qué está sucediendo

In the same way, it executes a command to know the use of the system's RAM and swap memory, showing a tip if there is a high percentage of use to contact the administrator and see what is happening.


5. Service status

Se ejecuta una revisión de cada uno de los demonios del sistema, para comprobar que todos los procesos esenciales se estén ejecutando de manera correcta.

Se ejecuta una revisión de cada uno de los demonios del sistema, para comprobar que todos los procesos esenciales se estén ejecutando de manera correcta.

Se ejecutan los siguientes comandos

The following commands are executed:

  • service omkd status
  • service mongod status
  • service nmisd status (si aplicaif applicable)
  • service nmis9d status (si aplicaif applicable)
  • service httpd status
  • service opchartsd status
  • service opeventsd status
  • service opconfigd status
  • service opflowd status
  • service crond status
  • service snmpd status
  • service iptables status

De igual forma, se revisa que SELinux esté desactivado

En caso de que se detecte que algún servicio esté down y sea importante para el funcionamiento del sistema, debe reiniciarse como indica el script.

En caso de que se detecte que algún servicio esté down y sea importante para el funcionamiento del sistema, debe reiniciarse como indica el script.

Si persiste el down, deberá revisarse el log de dicho demonio y analizarse para ver qué está sucediendo

If the down persists, the log of that daemon should be reviewed and analyzed to see what is happening.

6. Load average

Esta prueba permite saber la carga promedio del sistema para un periodo de tiempo definido.

El script nos muestra algunas interpretaciones para saber qué está sucediendo en el servidor:


This test allows to know the average load of the system for a defined period of time.

The script shows us some interpretations to know what is happening on the server:

  • If the averages are 0.0, then the system is idle.
  • If the 1 minute average is higher than the 5 or 15 minute averages, then the load is increasing.
  • If the 1 minute average is lower than the 5 or 15 minute averages, then the load is decreasing.
  • If the averages are higher than the CPU count, you may have a performance issue.


7. Top 5 processes by CPU and Memory

Muestra los 5 principales procesos que están utilizando más porcentaje del CPU en el servidor, además de detalles del CPU y de la memoria.

Muestra los 5 principales procesos que están utilizando más porcentaje del CPU en el servidor, además de detalles del CPU y de la memoria.

Al final muestra un tip de que si los procesos superan el 85% de la CPU o la memoria, se realice una investigación, ya que podría ser un caso de procesos que se han quedado colgados o que no responden

At the end it shows a tip that if the processes exceed 85% of the CPU or memory, an investigation is carried out, since it could be a case of processes that have been hung or that do not respond.


8. Tcpdump

El comando tcpdump nos permite capturar en un archivo el tráfico de la red en la que se encuentre el servidor del cliente.

Con esto, el operador puede saber si existe algún problema en la comunicación entre el servidor y los equipos agregados a NMIS y sus módulos, ya que al analizarlo se dará cuenta si existe pérdida de paquetes en el tráfico de la red.

Cuando termina la ejecución del comando, se crean archivos .pcap para que puedan descargarse y analizarse con The tcpdump command allows us to capture the traffic of the network in which the client's server is located in a file.

With this, the operator can know if there is any problem in the communication between the server and the equipment added to NMIS and its modules, since when analyzing it, they will realize if there is packet loss in the network traffic.

When the command execution finishes, 2 .pcap files are created in /tmp so they can be downloaded and analyzed with Wireshark.


9. Local IP routing table

Permite conocer el estado y configuración de las tablas de rutas IP, que nos sirven para enviar y saber cómo se envían los paquete en las distintas redes que se tienen configuradas en el servidor en cuestión

10. List of logged users.

Permite saber quiénes son los usuarios que están utilizando el shell en ese momento, esto servirá para mantener una mejor administración de las personas que acceden y, en algunas ocasiones, de los que modifican algún archivo importante del sistema


11. Log user audit

Es importante conocer el inicio de sesión de cada uno de los usuarios que utilizan el sistema, esto servirá para saber si alguno de ellos realizó alguna modificación que podría haber ocasionado el mal funcionamiento del mismo. 

La ejecución de esta sección, permite revisar logs del sistema, obtiene una vista de usuarios conectados, búsqueda de errores, mensajes críticos y alertas en los registros del sistema operativo.

Al final, se muestra un tip para que, si el operador observa muchos intentos de autenticación fallidos, contacte a los usuarios para que pueda saber qué está sucediendoIt is important to know the login of each of the users who use the system, this will help to know if any of them made any changes that could have caused the system to malfunction. 

The execution of this section allows you to review system logs, obtain a view of connected users, search for errors, critical messages and alerts in the operating system logs.

At the end, a tip is displayed so that if the operator observes many failed authentication attempts, contact the users so that they can find out what is happening.


12. Show last used commands

Esta revisión va de la mano con el punto anterior y nos permitirá conocer los últimos 30 comandos ejecutados en el servidor.

Esta revisión va de la mano con el punto anterior y nos permitirá conocer los últimos 30 comandos ejecutados en el servidor.

De igual forma, los 10 comandos más utilizados de esa lista de 30 y el número de veces que se han ejecutado

Similarly, the 10 most used commands from that list of 30 and the number of times they have been executed.


13. Show DNS config

La revisión del archivo /etc/resolve.conf es importante, ya que nos permitirá saber si la configuración de los nombres de dominio y la redirección a alguna IP importante es correcta.

Se puede confirmar que la estructura del archivo señalado es la adecuada

It can be confirmed that the structure of the indicated file is correct.




Se realiza una prueba para enviar tres paquetes de internet al servidor de Google y verificar la conectividad a internet del servidor. Esto sirve para poder actualizar paquetes que requieran descargarse vía internet directamente en consola, como yum y cpan.


Internet web test

A test is performed to send three internet packets to the Google server and verify the internet connectivity of the server. This is used to be able to update packages that need to be downloaded via the internet directly to the console, such as yum and cpan.

Similarly, it shows the public IP of the server.


2. NMIS Configuration Consistency

Se puede elegir entre diferentes opciones, las cuales se muestran a continuación


1. Check NMIS code

Permite comprobar la sintaxis de los archivos de configuración de la carpeta /usr/local/nmis8/* y muestra si hay algún error en los códigos.

Se muestra un tip para que el operador revise los archivos que se encuentren con alguna inconsistencia

A tip is displayed for the operator to review the files that are found to have any inconsistencies.


2. Perform a configuration backup

Realiza una copia de seguridad de los directorios de configuración para conservar todos los ajustes realizados por el cliente.

Debe señalarse la carpeta en la cual se va a realizar este respaldo, en este ejemplo utilizamos /tmp y el script comenzará a ejecutarlo.

El programa muestra el árbol de las carpetas y archivos respaldados y el nombre del archivo .tar.gz generadoMake a backup copy of the configuration directories to preserve all the settings made by the client.

The folder in which this backup will be made must be indicated, in this example we use /tmp and the script will start executing it.

The program displays the tree of the backed up files and folders and the name of the generated .tar.gz file.


3. Compare file configurations

Permite realizar una comparación de los archivosAllows you to compare the files:

  • /usr/local/nmis8/install/Config.nmis y and /usr/local/nmis8/conf/Config.nmis
  • /usr/local/omk/install/opCommon.nmis y and /usr/local/omk/conf/opCommon.nmis

Para poder encontrar alguna inconsistencia en la configuración que puedan estar causando algún problema con NMIS y/o los módulos


4. Execute fixperms rutine

Ejecuta en automático el comando /usr/local/nmis8/admin/fixperms.pl, que permite al operador la corrección general de los permisos de todos los archivos del sistema

TSWImage Modified

5. Model checking

Ejecuta una validación de sintaxis y verificación de longitud variable en los archivos de la carpeta de modelos Runs a variable-length check and syntax validation on the files in the /usr/local/nmis8/models/* .

Es importante para que el operador pueda tener funcionando de manera correcta cada uno de los diferentes modelos de los equipos agregados a NMIS.

Si el script encuentra algún detalle, lo señala y al final da un tip para que el operador revise esa inconsistenciamodels folder.

It is important so that the operator can have each of the different models of equipment added to NMIS working correctly.

If the script finds any detail, it signals it and at the end it gives a tip for the operator to review that inconsistency.


6. Crontab checking

Ejecuta una comprobación de la configuración de cada uno de los archivos de cron con los que NMIS y los módulos funcionan, esto para comprobar que no exista alguna rutina que esté causando algún conflicto que pueda afectar el funcionamiento del sistema.

De igual forma, ejecuta un ll en Runs a configuration check of each of the cron files that NMIS and the modules work with, to check that there is no routine that is causing a conflict that could affect system operation.

In the same way, it executes an ll in /etc/cron.d/ para comprobar que no se tienen backups dentro de esa carpeta, ya que puede provocar problemas para la ejecución de las tareas y da un tip para que, si se encuentran backups, se muevan de carpeta o se eliminento check that there are no backups inside that folder, since it can cause problems for the execution of the tasks and it gives a tip so that, if backups are found, are moved from folder or deleted.


7. Verify CPAN libraries

Ejecuta una comprobación de las bibliotecas CPAN y muestra cuáles hacen falta para que el operador pueda instalarlas en caso de ser necesario


8. Last changed files

Ejecuta una búsqueda de los últimos archivos modificados en diferentes directorios

  • /nmis8/admin/
  • /nmis8/bin/
  • /nmis8/cgi-bin/
  • /nmis8/conf/
  • /nmis8/models/
  • /nmis8/lib/
  • /omk/conf/
  • /etc/cron.d/

Y los acomoda del archivo modificado más recientemente hasta el más antiguo.

Y los acomoda del archivo modificado más recientemente hasta el más antiguo.

Al final, se muestra un tip para que el operador verifique si algún cambio reciente en los archivos está causando un problema en el sistema

At the end, a tip is displayed for the operator to check if any recent file changes are causing a problem in the system.


3. Nodes Troubleshooter

Se puede elegir entre diferentes opciones, las cuales se muestran a continuación


1. Polling summary

Ejecuta el comando /usr/local/nmis8/admin/polling_summary.pl, que sirve para conocer el tiempo que el servidor tarda en recolectar la información de los nodos agregados a NMIS y si alguna operación está fallando o nunca se ha realizado (como las consultas SNMP, por ejemplo).

Al final, se puede ver un resumen de cuántos nodos tienen un collect tardío y, presionando la tecla l (ele), se puede enviar este resumen hacia un archivo para que se pueda descargar del servidor

At the end, you can see a summary of how many nodes have a late collect and, by pressing the l key, you can send this summary to a file so that it can be downloaded from the server.


2. Traceroute

Permite rastrear en tiempo real la ruta tomada por un paquete en una red IP desde el origen hasta el destino, informando las direcciones IP de todos los enrutadores entre los que hizo ping.

Permite rastrear en tiempo real la ruta tomada por un paquete en una red IP desde el origen hasta el destino, informando las direcciones IP de todos los enrutadores entre los que hizo ping.

Se coloca la IP o el hostname del nodo y el script devolverá el resultado, mostrando un tip para el operador si se observa algún comportamiento anormal

Enter the IP or hostname of the node and the script will return the result, displaying a tip for the operator if any abnormal behavior is observed.


3. MTR

Permite analizar la conexión entre el servidor donde se ejecuta el comando y el host destino especificado por el usuario.

Permite analizar la conexión entre el servidor donde se ejecuta el comando y el host destino especificado por el usuario.

Se coloca la IP o el hostname del nodo y el script devolverá el resultado, mostrando un tip para el operador si se observa algún comportamiento anormal

Enter the IP or hostname of the node and the script will return the result, displaying a tip for the operator if any abnormal behavior is observed.


4. Ping

Permite probar si un host en particular es alcanzable a través de la red configurada en el servidor y medir el tiempo que tardan los paquetes en enviarse y recibirse.

Se coloca la IP o el hostname del nodo y el script devolverá el resultado, mostrando un tip para el operador si se observa algún comportamiento anormal.

Permite consultar los datos SNMP de un dispositivo. Se utiliza el comando snmpwalk porque le permite al usuario encadenar solicitudes sin tener para ingresar comandos únicos para cada OID o nodo dentro de un subárbol.

Esto ayuda a saber si el nodo en cuestión está respondiendo de forma correcta al protocolo y a comprobar que NMIS esté recopilando sus métricas adecuadamente.

El script cuenta con consultas SNMPv1, SNMPv2 o SNMPv3 y al final muestra un tip para que el operador consulte al administrador en caso de que el equipo tenga problemas en la respuesta.

Permite realizar un update a un nodo específico, utilizando su hostname.

Se ejecuta el comando It allows you to test whether a particular host is reachable through the network configured on the server and measure the time it takes for packets to be sent and received.

Enter the IP or hostname of the node and the script will return the result, displaying a tip for the operator if any abnormal behavior is observed.

Allows you to query the SNMP data of a device. The snmpwalk command is used because it allows the user to chain requests without having to enter unique commands for each OID or node within a subtree.

This helps to know if the node in question is responding correctly to the protocol and to verify that NMIS is collecting its metrics correctly.

The script has SNMPv1, SNMPv2 or SNMPv3 queries and at the end it shows a tip for the operator to consult the administrator in case the device has problems in the response.

6. Update

Allows you to perform an update to a specific node, using its hostname.

The command /usr/local/nmis8/bin/ is executed type=update node='nodonode' force=1 debug=1


7. Collect nodes

Permite realizar un collect a un nodo específico, utilizando su hostname.

Se ejecuta el comando Allows you to perform a collect to a specific node, using its hostname.

The command /usr/local/nmis8/bin/ is executed type=collect node='nodonode' force=1 debug=1


8. Event search

Permite realizar búsquedas en las carpetas It allows searches in the /usr/local/nmis8/logs/ y and /usr/local/omk/logs/ , lo cual facilitará al operador la investigación cualquier hecho o acontecimiento que esté causando alguna falla en el servidor.

Debe colocarse la palabra o palabras a buscar para poder realizar la operación.

Permite realizar búsquedas en las carpetas /usr/local/nmis8/logs/ y /usr/local/omk/logs/, lo cual facilitará al operador la investigación cualquier hecho o acontecimiento que esté causando alguna falla en el servidor.

Debe colocarse la palabra o palabras a buscar para poder realizar la operación.

The word or words to be searched must be placed in order to carry out the operation.


9. Nodes.nmis backup

Permite realizar un backup del archivo actual Allows you to make a backup of the current Nodes.nmis file, ubicado en located in /usr/local/nmis8/conf/.

Esto es muy importante para el operador, sobre todo antes de realizar cualquier modificación que tenga que ver con los equipos agregados a This is very important for the operator, especially before making any changes that have to do with the equipment added to NMIS.







Allows you to run the NMIS support tool and modules, which collects all the relevant information about the status and configuration of the server in 2 files:


Al final, estos dos archivos deberán ser adjuntados al mail enviado al Soporte de Opmantek para su análisisIn the end, these two files should be attached to the email sent to Opmantek Support for analysis.


4. Smart Diagnostic

Permite ejecutar de forma automática todas las pruebas contenidas en el script con solo acceder a la opción correspondiente.

Al final, se genera un archivo .tar.gz que deberá ser adjuntado por el operador si se abre un ticket de Soporte, como se menciona en el tip.

TSWImage RemovedIt allows automatically executing all the tests contained in the script just by accessing the corresponding option.

At the end, a .tar.gz file is generated that must be attached by the operator if a Support ticket is opened, as mentioned in the tip.

5. Create System Backup File

Realiza una copia de seguridad de los directorios de configuración para conservar todos los ajustes realizados por el cliente.

Debe señalarse la carpeta en la cual se va a realizar este respaldo, en este ejemplo utilizamos /tmp y el script comenzará a ejecutarlo.

TSWImage RemovedMake a backup copy of the configuration directories to preserve all the settings made by the client.

The folder in which this backup will be made must be indicated, in this example we use /tmp and the script will start executing it.

The program displays the tree of the backed up files and folders and the name of the generated .tar.gz file.

6. Execute Support Automation Tool

Permite ejecutar la herramienta de soporte de NMIS y los módulos, la cual recopila toda la información relevante sobre el estado y la configuración del servidor en 2 archivos:

  • /tmp/nmis-support.tar.gz
  • /tmp/omk-support.tar.gz

Al final, estos dos archivos deberán ser adjuntados al mail enviado al Soporte de Opmantek para su análisis.


Al final, estos dos archivos deberán ser adjuntados al mail enviado al Soporte de Opmantek para su análisis.

TSWImage RemovedIn the end, these two files should be attached to the email sent to Opmantek Support for analysis.

