Gestión de Eventos

Flujo del proceso: La Gestión de Eventos: Proporciona información de entrada a otros procesos de la fase de operación: Gestión de Incidencias y Gestión de Problemas. Contribuye a la Mejora Continua del Servicio enviando nuevas RFCs a la Gestión de Cambios.

Monitorización y Seguimiento: El proceso de Gestión de Eventos debe ser controlado para: Asegurar que se lleven a cabo las tareas programadas. No existan duplicaciones a la hora de notificar un mismo evento. No se pasan por alto eventos significativos ni se sobredimensionan eventos insignificantes.

Aparición del evento: El proceso se inicia cuando ocurre el suceso y sea detectado. 

Notificación: La existencia del suceso es notificada a través de: Una herramienta de gestión que analiza periódicamente los Elementos de Configuración CIs. El propio CI genera un informe al darse unas determinadas condiciones definidas previamente.

Detección y filtrado: La notificación llega a un agente o herramienta de gestión que: Lee la notificación. Interpreta los datos relacionados con el suceso. Decide si el evento se comunica o no a la herramienta de gestión.

Clasificación: Las categorías en las que se suelen clasificarse los eventos incluyen, como mínimo: Informativo, Alerta o excepción.

Correlación: Se interpreta el evento, teniendo en cuenta: Categorización (Informativo, Alerta o excepción) y nivel de prioridad. Existencia de otros eventos similares, especialmente en los mismos CIs. Acciones asociadas al evento. ¿Representa una excepción? ¿Se necesitan más datos?

Disparadores: Hay varios tipos de disparadores: Disparadores de Incidentes y de Cambios. Disparadores procedentes de una RFC aprobada o rechazada. Notificaciones por teléfono móvil. Scripts automatizados y disparadores de bases de datos.

Opciones de respuesta: Entre las más comunes están: Registro de eventos, respuesta automática o alerta para intervención humana, emisión de una solicitud de cambio (RFC) y apertura de un registro o vinculación con un registro previo.

Revisión de acciones: Se revisan todas las excepciones o eventos importantes para: Determinar si se han tratado correctamente. Comprobar que se hace un recuento de tipos de eventos.

Cierre: Una vez terminada todas las acciones de respuesta asignadas al suceso, se da por cerrado el evento.

El principal objetivo de la Gestión de Eventos, en su función de monitorizar todos los sucesos importantes, consiste en detectar y escalar condiciones de excepción para así contribuir a una operación normal del servicio:

  • Proporcionando puntos de entrada para varios procesos de la fase de Operación, por ejemplo, Gestión de Incidencias
  • Posibilitando la comparación entre el rendimiento real del servicio con los estándares de diseño y los SLAs.
  • Contribuyendo a la Mejora Continua del Servicio mediante informes de mejora.

Algunas de las ventajas que una correcta Gestión de Eventos aporta a la organización TI son:

  • Ayuda a la detección temprana de incidentes, llegando incluso a evitar que éstos se manifiesten a los usuarios.
  • Además, la coordinación directa con otros procesos hace posible que éstos reaccionen con mayor rapidez, resultando en una mayor eficiencia de toda la organización TI.
  • Posibilita la monitorización automatizada de determinadas actividades. 
  • Proporciona la base para las operaciones automatizadas, que incrementan la eficiencia y descargan de trabajo a los recursos humanos que, así, pueden ser empleados en otras tareas como diseñar nuevas funcionalidades, etc…

Entre los principales desafíos que pueden obstaculizar la labor de la Gestión de Eventos encontramos:

  • Dificultades en la obtención de fondos para contratar las herramientas necesarias y el esfuerzo necesario para configurarlas y explotar sus beneficios.
  • Los niveles de filtrado no son adecuados, bien por exceso (se gestionan eventos sin impacto real en el servicio) o por defecto (algunos eventos de importancia no se detectan hasta que es demasiado tarde)
  • No existe suficiente compromiso con la Gestión de Eventos en otros procesos del ciclo de vida, ocasionando retrasos en la respuesta a los eventos.
  • Adquirir las habilidades necesarias exige tiempo y dinero.

Clasificación de eventos: No todos los eventos son iguales ya que no tienen la misma importancia para el servicio ni la infraestructura TI y por tanto, no deben tratarse de la misma manera. Existen tres clases de eventos diferenciados según su importancia:  

Evento Informativo: Se asigna a aquellos eventos que no requieren, en principio, ninguna respuesta y que por tanto no representan una excepción, ejemplo, notificación de un correo nuevo.

Evento de Alerta. Se asigna a aquellos eventos que indican que el servicio se aproxima a un umbral. Su objetivo es notificar a las personas, herramientas o procesos apropiados para que revisen la situación y tomen las medidas necesarias para evitar que se produzca una excepción, ejemplo, uso de CPU 85%

Eventos de Excepción. Se asigna a los eventos cuando indican que el servicio está operando de manera irregular: los SLAs y OLAs se han incumplido, etc. Las excepciones pueden representar un fallo total, un cese en una funcionalidad o una disminución del rendimiento. Sin embargo, no tienen por qué ser errores, ejemplo, Apache no se ejecuta correctamente, señal que la pagina esta caida.  

Gestión de Incidencias: La Gestión de Eventos alimenta el proceso de Gestión de Incidencias abriendo registro de aquellos sucesos que acarrean una interrupción del servicio y deben ser subsanados. 

Gestión de Problemas: La Gestión de Eventos alimenta al proceso de Gestión de Incidencias detectando y registrando aquellos sucesos que se repiten sin causa conocida y que es necesario explicar  y corregir.

Gestión de Cambios:   La Gestión de Eventos envía ocasionalmente nuevas solicitudes de cambio basándose en conclusiones extraídas a partir de la correlación de sucesos.  

Mejora Continua del Servicio (CSI): A través de la colaboración entre la Gestión de Eventos y la Gestión de cambios, la fase de Mejora Continua del Servicio obtiene nuevas entradas.  

Diseño del Servicio: Las decisiones tomadas en esta fase respecto a la configuración de ciertas tareas automáticas de los CIs, como las notificaciones, tienen una implicación directa en el desarrollo de la Gestión de Eventos.    

A la hora de evaluar la eficiencia y efectividad del proceso de Gestión de Eventos deben verificarse los siguientes indicadores:

  • Número de eventos, por categorías.
  • Número de eventos, por importancia.
  • Número y porcentaje de eventos que desembocaron en el registro de una nueva incidencia o solicitud de cambio.
  • Número y porcentaje de eventos ocasionados por problemas ya existentes o errores conocidos.
  • Número y porcentaje de eventos repetidos o duplicados. Esto es relevante para optimizar la función de Correlación.
  • Número y porcentaje de eventos relacionados con problemas de rendimiento.
  • Número y porcentaje de eventos que indican futuros problemas de disponibilidad.