Manual operativo de opTrend
Introducción
En el presente documento se mostrarán algunas características y funcionalidades que nos provee opTrend, además de la interpretación de la información generada, con la finalidad de poner en marcha la operación del modulo.
opTrend es un módulo que integra gráficos de NMIS, contiene funciones que proporcionan una predicción del funcionamiento de los nodos a corto plazo que permitirán al cliente establecer pasos a seguir para poder prevenir problemas futuros.
Funcionalidades principales de opTrend:
- Predecir recursos futuros para la entrega del servicio (operación).
- Pronosticar tendencias y patrones mediante Desviación Estándar.
- Optimizar la elaboración de presupuestos.
- Mostrar un TopN de métricas que estén por encima de la media (mean) y casi llegando a un máximo (upper control).
- Identificar tendencias que puedan generar un problema a corto plazo.
¿Cómo funciona opTrend?
opTrend utiliza un algoritmo llamado "SETDS" (Statistical Exception and Trend Detection System), el cual toma 26 semanas de datos, superpone cada semana una encima de la otra (en cortes de 2h) de modo que los datos se organizan en 1 semana y cada corte de tiempo de 2h tiene 26 puntos de datos. A continuación, calcula la desviación estándar de cada tramo de 2 horas y la multiplica por 3, lo que se convierte en la línea de control superior (upper control); el control inferior (lower control) es simplemente el mismo valor * -3.
¿Por qué la desviación estándar se multiplica por 3? La razón por la que un límite de control de 3σ equilibra el riesgo de error es que, para datos distribuidos normalmente, los puntos de datos caerán dentro de los límites de 3σ el 99,7% de las veces cuando un proceso está en control.
A medida que NMIS sondea opTrend añade en el sondeo/rendimiento de 5 minutos, si el valor está por encima del control, opTrend calcula el área sobre el control, esto se llama el "EV" (valor extra), los valores EV se utilizan para crear eventos, la gravedad basada en cuánto está por encima del control. El EV se almacena y se utiliza para crear los documentos de la cartelera, así como para mostrar los gráficos en la página principal.
¿Qué es SETDS?
SETDS es la metodología creada por Igor Trubin e incorporada por Opmantek en opTrend que utiliza el filtrado estadístico, el reconocimiento de patrones, los umbrales dinámicos frente a los estáticos, los gráficos de control de TI, los informes basados en valores de excepción/alertas inteligentes y la detección de puntos de cambio/tendencias basados en valores de excepción para realizar la gestión de la capacidad de los sistemas, incluida la planificación de la capacidad y la ingeniería del rendimiento. (Referencia: https://www.trub.in/2012/11/setds-methodology-cmg12-speech.html)
En el siguiente video, podrá encontrar cómo interpretar la información de las gráficas generadas e incluso poder realizar un ejercicio ejemplo con datos de una gráfica de NMIS en la página http://www.perfomalist.com/.
Acceso a opTrend
El acceso a opTrend se deberá realizar mediante la siguiente ruta: http://serverip/en/omk/opTrend. El demonio que permite la operación del módulo es omkd.
Manejo del módulo
El dashboard principal del módulo está compuesto por un TopN de gráficas que son tomadas desde NMIS (siempre y cuando los nodos las contengan), en el cual podremos ver las siguientes métricas:
- Node Health, recursos de salud del nodo: cpuLoad, MemoryUtil, tcpCurrEstab, hrSystemProcesses.
- Interface Trend, recursos de interfaces del nodo: ifInUtil, ifOutUtil, ifInErrors, ifOutErrors, ifInDiscards, ifOutDiscards.
Estas métricas pueden ocultarse vía código, pero no pueden agregarse nuevas.
Este TopN siempre mostrará nodos en los cuales las métricas estén por encima de la media estándar, con lo cual el cliente podrá fijar su atención para saber qué medidas tomar antes de que esto pueda repercutir en el funcionamiento de éstos.
Vista de un nodo del TopN
Vamos a detallar la vista de un nodo del TopN.
- Damos clic en la barra de un nodo, en este caso el nodo es Winnow y la métrica es cpuLoad.
- Se abrirán los detalles de la tendencia de la métrica de cpuLoad en la semana actual, en la cual podremos ver 5 líneas, las cuales describimos a continuación:
- lower_control (línea inferior azul): desviación estándar de cada tramo de 2 horas multiplicada por 3.
- upper_control (línea superior azul): desviación estándar de cada tramo de 2 horas multiplicada por -3.
- mean (línea verde): 26 semanas de datos, cada semana superpuesta una encima de la otra (en cortes de 2h) de modo que los datos se organizan en 1 semana.
- cpuLoad (línea negra): valor real de la métrica obtenida desde NMIS.
- fecha actual (línea roja): separación entre la fecha actual y las fechas de predicción del módulo; esta línea va recorriéndose hacia la derecha conforme va pasando la semana actual.
- Del lado izquierdo podremos ver más información acerca de los detalles de la tendencia, como son, a grandes rasgos:
- _id: id del nodo en NMIS.
- average_mean: valor promedio del mean (línea verde en la imagen de arriba).
- qué metricas muestra la gráfica.
- fechas de inicio y término de la información de la gráfica.
- nombre del nodo.
- qué recurso muestra la gráfica (cpu, memoria, etc.).
- nombre de la tendencia.
Views > TopN Billboards
Al acceder al menú Views > Billboards, podremos ver un tablero de top de los elementos que están por encima de la media estándar y una tabla de información de cuántas semanas han permanecido en él.
Este TopN puede ser modificado para mostrar los valores requeridos por el cliente en la siguiente linea del archivo opCommon.nmis:
'optrend_billboard_topn' => 25,
TopN Billboard de cpuLoad
En la tabla se podrán ver varios parámetros, los cuales describiremos a continuación (en este ejemplo, se ha seleccionado el TopN Billboard de cpuLoad):
- Position (change): posición actual del elemento en el Billboard; flecha arriba si ha subido de lugar, guión si ha permanecido en el mismo lugar, flecha abajo si ha bajado de lugar; entre paréntesis aparece el número de lugares que ha subido o ha bajado.
- Name: nombre del nodo y elemento (según el parámetro que se haya seleccionado en el TopN).
- weeks_in_billboard: número de semanas que ha permanecido en la tabla el elemento.
- View Seeds: al dar clic en el símbolo del ojo se podrán observar los detalles de la tendencia de la métrica que ya se ha mostrado y detallado anteriormente.
Views > Trends: búsqueda de tendencias de un nodo específico
Al acceder al menú Views > Trends, podremos realizar una búsqueda de tendencias de un nodo específico. Se puede buscar por nodo (Node), por nombre del recurso (Resource Name) y por campo (Field); mientras más información se coloque en la búsqueda, mejor será el resultado.
Realizaremos un ejemplo de búsqueda de nodos que contienen la cadena "CNOC_TRIARA_" y con el Resource Name "CPU".
Cabe destacar que estos campos son regex y distinguen mayúsculas y minúsculas.
En esta búsqueda aparecen como resultado 7 nodos que coinciden y podremos observar en la tabla varias columnas, como son:
- Node Name: nombre del nodo en NMIS.
- Resource Name: nombre del recurso.
- Campo: nombre de la métrica del recurso.
- Start Date: fecha de inicio de la semana en curso.
- Last Updated: fecha de última actualización (día y hora actuales).
De esta forma, se pueden realizar búsquedas específicas de un nodo y ver sus tendencias.