Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

TSWImage Modified

Esta página está destinada a proporcionar información de la instalción y uso del Troubleshooting Wizard, que tiene como objetivo ayudar a los clientes a ejecutar un diagnóstico completo de su(s) servidor(es) para determinar la causa raíz de algún probable problema que se esté presentando.

...

Una vez que ya se tenga el archivo en el servidor, lo ejecutamos con el comando: sh 01_TS_Wizard_OMK.sh

TSWImage RemovedTSWImage Added

Una vez que hayamos ejecutado el archivo, accederemos a la pantalla inicial, donde se muestran los detalles del Sistema Operativo, como es la versión de Linux y un pequeño resumen de la memoria y CPU del sistema.

...

Podremos elegir entre diferentes opciones, las cuales se muestran a continuación:

Image RemovedTSWImage Added

1. TOP

Este comando nos da información de todos los procesos que se están ejecutando en este momento en el servidor y el porcentaje de utilización de CPU y memoria RAM.

...

  • Comprobar las particiones de los discos.
  • Limpiar archivos de registro que ocupen demasiado espacio.
  • Eliminar caché.

Image RemovedTSWImage Added

2. System date and time

...

Es por eso que se incluye este apartado para que el operador sepa que la fecha y hora del sistema son adecuadas. Al final, en caso de que el servidor no tenga un NTP activado, se muestra un tip para contactar al administrador del sistema y verificarlo.

Image RemovedTSWImage Added

3. Disk R/W

Con este análisis, podremos darnos cuenta si existe una falla física en los discos del servidor.

...

De igual forma, se ejecuta un iostat -x 5 4, que se usa para monitorear la carga IO del equipo del sistema. Si se tiene un alto %util, es muy probable que exista un problema que pueda llevar incluso a la pérdida de datos, lo cual se señala al final de la ejecución del comando.Image Removed

TSWImage Added

4. Filesystem

Muestra un análisis detallado del espacio en cada uno de los filesystems del sistema, esto para comprobar que la posible incidencia no se esté presentando por una falta de espacio en el servidor. También muestra un tip de que si el uso es +85% en alguno de los ficheros, se contacte al administrador para que se puedan depurar.

De igual forma, ejecuta un comando para saber la utilización de la memoria RAM y swap del sistema, mostrando un tip si se tiene un alto porcentaje de utilización para contactar al administrador y ver qué está sucediendo.Image Removed

TSWImage Added

5. Service status

Se ejecuta una revisión de cada uno de los demonios del sistema, para comprobar que todos los procesos esenciales se estén ejecutando de manera correcta.

...

De igual forma, se revisa que SELinux esté desactivado.

Image RemovedTSWImage Added

En caso de que se detecte que algún servicio esté down y sea importante para el funcionamiento del sistema, debe reiniciarse como indica el script.

...

  • Si los promedios son 0.0, entonces el sistema está inactivo.
  • Si el promedio de 1 minuto es más alto que los promedios de 5 o 15 minutos, entonces la carga está aumentando.
  • Si el promedio de 1 minuto es más bajo que los promedios de 5 o 15 minutos, entonces la carga está disminuyendo.
  • Si los promedios son más altos que el recuento del CPU, es posible que se tenga un problema de rendimiento.

Image RemovedTSWImage Added

7. Top 5 processes by CPU and Memory

...

Al final muestra un tip de que si los procesos superan el 85% de la CPU o la memoria, se realice una investigación, ya que podría ser un caso de procesos que se han quedado colgados o que no responden.

Image RemovedTSWImage Added


8. Tcpdump

El comando tcpdump nos permite capturar en un archivo el tráfico de la red en la que se encuentre el servidor del cliente, para después analizarlo con algún programa como Wireshark.

Con esto, el operador puede saber si existe algún problema en la comunicación entre el servidor y los equipos agregados a NMIS y sus módulos, ya que al analizarlo se dará cuenta si existe pérdida de paquetes en el tráfico de la red.

Cuando termina la ejecución del comando, se crean archivos .Image Removedpcap para que puedan descargarse y analizarse con Wireshark.

TSWImage Added

9. Local IP routing table

...

Permite saber quiénes son los usuarios que están utilizando el shell en ese momento, esto servirá para mantener una mejor administración de las personas que acceden y, en algunas ocasiones, de los que modifican algún archivo importante del sistema.

Image RemovedTSWImage Added

11. Log user audit

...

La ejecución de esta sección, permite revisar logs del sistema, obtiene una vista de usuarios conectados, búsqueda de errores, mensajes críticos y alertas en los registros del sistema operativo.

Image Removed

...

Al final, se muestra un tip para que, si el operador observa muchos intentos de autenticación fallidos, contacte a los usuarios para que pueda saber qué está sucediendo.

TSWImage Added


12. Show last used commands

Esta revisión va de la mano con el punto anterior y nos permitirá conocer los últimos 30 comandos ejecutados en el servidor.

De igual forma, los 10 comandos más utilizados de esa lista de 30 y el número de veces que se han ejecutado.

Image RemovedTSWImage Added

13. Show DNS config

...

Se puede confirmar que la estructura del archivo señalado es la adecuada.

Image RemovedTSWImage Added

14. Prueba de internet

...

De igual forma, muestra la IP pública del servidor.

Image RemovedTSWImage Added

2. NMIS Configuration Consistency

Podremos elegir entre diferentes opciones, las cuales se muestran a continuación:

TSWImage Added

1. Check NMIS code

Permite comprobar la sintaxis de los archivos de configuración de la carpeta /usr/local/nmis8/* y muestra si hay algún error en los códigos.

Se muestra un tip para que el operador revise los archivos que se encuentren con alguna inconsistencia.

Image RemovedTSWImage Added

2. Perform a configuration backup

...

El programa muestra el árbol de las carpetas y archivos respaldados y el nombre del archivo .tar.gz generado.

Image RemovedTSWImage Added

3. Compare file configurations

...

Para poder encontrar alguna inconsistencia en la configuración que puedan estar causando algún problema con NMIS y/o los módulos.

Image RemovedTSWImage Added

4. Execute fixperms rutine

Ejecuta en automático el comando /usr/local/nmis8/admin/fixperms.pl, que permite al operador la corrección general de los permisos de todos los archivos del sistema.

Image RemovedTSWImage Added

5. Model checking

...

Si el script encuentra algún detalle, lo señala y al final da un tip para que el operador revise esa inconsistencia.

Image RemovedTSWImage Added

6. Crontab checking

...

De igual forma, ejecuta un ll en /etc/cron.d/ para comprobar que no se tienen backups dentro de esa carpeta, ya que puede provocar problemas para la ejecución de las tareas.Image Removedproblemas para la ejecución de las tareas y da un tip para que, si se encuentran backups, se muevan de carpeta o se eliminen.

TSWImage Added

7. Verify CPAN libraries

Ejecuta una comprobación de las bibliotecas CPAN y muestra cuáles hacen falta para que el operador pueda instalarlas en caso de ser necesario.

Image RemovedTSWImage Added

8. Last changed files

...

Y los acomoda del archivo modificado más recientemente hasta el más antiguo.

Esto es importante Al final, se muestra un tip para que el operador pueda saber si alguna modificación en días recientes puede haber causado un mal funcionamiento del verifique si algún cambio reciente en los archivos está causando un problema en el sistema.

Image RemovedTSWImage Added

3. Nodes Troubleshooter

...

Permite realizar un update a un nodo específico, para saber si se está realizando correctamente. 

7. Collect nodes

Permite realizar un collect a un nodo específico, para saber si se está realizando correctamente.

...