ITmetro facilita la gestión de enlaces WAN

Ver Documento PDF

Contexto y necesidades

La  mayoría  de  las  empresas  y  organizaciones  contratan  losservicios  de  enlaces

WAN(conectividad “privada” entre puntos de presencia de mediana y larga distancia)

a  empresas de telecomunicaciones (TelCos, Carriers).

Las  TelCos,  abono  mensual  mediante,  se  suelen  comprometer  a  garantizar  un  nivel

mínimo de calidad de servicio (SLA: Service Level Agreement), típicamente expresado

en términos de disponibilidad mínima (ej: 99,8% mensual), donde por “disponibilidad

del  enlace”  suele  entenderse:  el  porcentaje  del  tiempo  que  el  enlace  está  operativo

(“up”)  con    un  “ancho  de  banda  mínimo”  disponible,  tal  que,  mientras  el  tráfico

generado  esté  por  debajo  de  dicho  ancho  de  banda  garantizado,  no  se  debería

experimentar retardos ni pérdidas “significativas” de paquetes.

 

En  estos  casos,  por  cuestiones  decalidady  decostos,  esindispensable  que  la

empresa midadiversas métricas de los enlaces WAN, y en base al procesamiento de

dichas mediciones esté en condiciones de hacer lasgestionescorrespondientesante

la TelCo, como ser: reclamospor caída o errores de enlaces, aplicación demultassi

corresponde,  pedidos  deincremento  de  capacidad.  En  este  sentido  cabe

recomendar  que,  para  evitar  el  “conflicto  entre  juez  y  parte”,  dichas  mediciones  no

sean realizadas por la propia TelCo.

 

IT Metro para facilitar el soporte proactivo y el control de SLAs de los enlaces.

 

Con las herramientas dese mide  el estado operativo de cada enlace, y se

disparanAlertasante caídas, lo cual permite hacer inmediatamente el reclamo a la

TelCo, con el fin de minimizar el down-time.

El  estado  operativo  de  cada  enlace  puede  ser  medido  de  diversas  maneras,  por

ejemplo:

  1. Para casi cualquier tipo de enlace, mediante PING (ICMP Echo) a una direcciónIP alcanzable a través de dicho enlace;
  2. En  el  caso  de  un  enlace  Punto  a  Punto  transparente,  mediante  la  lectura  víaSNMP de la variable ifOperStatus de la interfase;
  3. En el caso de un PVC Frame Relay, mediante la lectura vía SNMP de la variablefrCircuitState;
  4. En  el  caso  de  un  enlace  IP/MPLS,  mediante  la  lectura  vía  SNMP  de  las  rutasaprendidas via BGP/OSPF/EIGRP/RIP.

 

Con las mediciones del estado operativo de cada enlace, se genera periódicamente  un

Reporte  de  Disponibilidadque  indica,  para  cada  enlace,  el  porcentaje  del  tiempo

que  el  enlace  estuvo  operativo  (Up&Running)  durante  el  período  de  medición

(mensual, semanal, diario).

El Reporte de Disponibilidad puede ser utilizado para controlar elAcuerdo de Nivel

de Servicio(SLA: Service Level Agreement) comprometido por el proveedor, lo cual

tendería a mejorar la calidad del servicio provisto por éste.

 

El  gráfico  siguiente  ilustra  como  ejemplo  la  medición  del  estado  operativo  de  un

enlace  mediante  el  tiempo  de  respuesta  a  un  ping,  y  el  umbral  de  comparación  ha

sido configurado en 3 segundos.

 

image4

 

En la imagen a continuación se puede ver un ejemplo de Reporte de Disponibilidad del

estado operativo de un enlace medido mediante ping. Los eventos de no disponibilidad

(falla,  indisponibilidad)  indican  el  período  de  tiempo  durante  el  cual  no  se  obtuvo

respuesta al ping. En este ejemplo la variable medida presentó una disponibilidad de

99,97%  durante  todo  el  mes  de  Marzo,  con  2  eventos  de  no  disponibilidad  de

aproximadamente 6 minutos cada uno.

 

image12

 

El  gráfico  siguiente  ilustra  como  ejemplo  la  medición  del  estado  operativo  de  un

enlace IP/MPLS mediante la lectura de las rutas aprendidas via BGP.

 

image6

 

En la imagen a continuación se puede ver un ejemplo de Reporte de Disponibilidad del

estado operativo de un enlace medido mediante la lectura de las rutas aprendidas via

BGP. Los eventos de no disponibilidad (falla) indican el período de tiempo durante el

cual la ruta correspondiente no fue aprendida. En este ejemplo las variables medidas

presentaron  una  disponibilidad  mayor  al  99,9%,  salvo  un    enlace  que  presentó  una

disponibilidad  muy  baja,  del  74,75%,  debido  a  5  eventos  que  totalizaron  10067

minutos de no disponibilidad.

 

image7

 

IT Metro para  facilitar  laplanificación  de  capacidad(capacity  planning) de  los enlaces

 

Con IT Metro se  mide  lautilizaciónde  cada  enlace,  por  lo  general  mediante  la

lectura vía SNMP de  la variable MIB apropiada (dependiendo del tipo de enlace), en

términos detráficoexpresado en bits por segundo.

En  base  a  dichas  mediciones,  se  genera  periódicamente  unReporte  de

Disponibilidadde  dichas  variables  que  indica,  para  cada  enlace,  el  porcentaje  del

tiempo que el enlace estuvo utilizado por debajo de un cierto umbral (por ej. <70%

de su capacidad máxima), durante el período de medición (mensual, semanal, diario).

Dicho Reporte de Disponibilidad se puede utilizar,para identificar los enlaces que

puedan estar saturados(los que presentan menor porcentaje de disponibilidad de

la  variable  de  tráfico),    analizar  los  gráficos  de  tráfico  y  composición  del  tráfico

(también  generados  por IT Metro)  de  dichos  enlaces,  ydeterminar  si  algún

enlace amerita ser redimensionado(aumentar su ancho de banda).

El  gráfico  ilustra  como  ejemplo  la  medición  de  tráfico  de  un  enlace  IP/MPLS  de  un

ancho  de  banda  de  1  Mbps  cuyo  umbral  de  comparación  ha  sido  configurado  a  0,7

Mbps, o sea 70% de su capacidad máxima.

 

image8

 

Cabe  destacar  que  los  enlaces  WAN  son  full-dúplex,  y  suelen  presentar  un  perfil  de

tráfico asimétrico, por lo cual para saber si están siendo correctamente utilizados es

necesario comparar con un cierto umbral tanto el tráfico entrante como el saliente.

En  el  Reporte  de  Disponibilidad  se  considera  que  la  variable  de  tráfico  esta  no

disponible  (o  indisponible,  o  en  falla)  siempre  que  su  valor  supere  el  umbral  (el  de

High en este caso), o sea mientras el enlace esté sobreutilizado.

En  el  ejemplo  a  continuación,  el  Reporte  indica  que  la  variable  presentó  una

disponibilidad  de  81,16%,  debido  a  9  eventos  de  una  duración  total  de  1898,90

minutos, durante los cuales el tráfico superó los 700 Kbps.

 

image9

 

El IT Metro también puede medir lacomposición del tráfico(por ejemplo usando

Netflows) y generar vistas y reportes que facilitan las tareas tendientes a determinar

si  el  enlace  está  siendo  utilizado  por  aplicaciones  y  protocolos  compatibles  con  las

politicas de la empresa y amerita ser redimensionado, o por el contrario corresponde

filtrar el tráfico no deseado.

En el gráfico siguiente se muestra la composición del tráfico, en un sentido y en el

otro (ya que es full-duplex), clasificando el tráfico por protocolo aplicativo.

image10

IT Metro para facilitar ladetección ycorrecciónde problemasde los enlaces

 

Con IT Metro se mide la cantidad de paquetes recibidos con error en la interfase

de  cada  enlace,  por  lo  general  mediante  la  lectura  vía  SNMP  de  la  variable  MIB

apropiada (dependiendo del tipo de enlace).

En  base  a  dichas  variables  medidas,  se  genera  periódicamente    unReporte  de

Disponibilidadque indica, para cada enlace, el porcentaje del tiempo que el enlace

tuvo  una  cantidad  de  paquetes  recibidos  con  error  por  encima  de  un  cierto  umbral,

durante el período de medición (mensual, semanal, diario).

Dicho Reporte de Disponibilidad se puede utilizar, entre otras cosas,para identificar

aquellos enlaces que puedan estar presentando una tasa de errores excesiva,

y  determinar  si  ameritanreclamos  a  la  TelCo,  o  si  es  necesariosolicitar  la

reparaciónde los dispositivos  involucrados.

El gráfico siguiente  ilustra como ejemplo la medición de errores de interfases, donde

la  variable  medida  representa  la  cantidad  de  errores  acumulados,  lo  cual  facilita  su

visualización. Si se mostrase la cantidad de errores por segundo, el instante en el cual

se producen los errores sería casi imperceptible (sería un “glitch”).

 

image11

 

En  el  ejemplo  a  continuación,  el  Reporte  indica  que  las  variables  presentaron  una

disponibilidad  de  100%,  o  sea  que  ninguna  interfase  presentó  errores  durante  el

período de medición.

 

image12

 

IT Metro Reportes de Disponibilidad.

 

Adicionalmente, cada Reporte de Disponibilidad del puede ser generado

  1. a demanda, y/o en forma automática y enviado por email,
  2. en formato pdf (acrobat) y/o csv (planilla de cálculo)

En el cálculo de disponibilidad se puede:

  1. aplicar un calendario (ej: días hábiles de  8 a 20 hs),
  2. excluir  ventanas  de  tiempo    (por  mantenimiento  programado,  por  falla  noimputable al proveedor)
  3. listar  solamente  los  enlaces  que  tuvieron  un  porcentaje  de  disponibilidadinferior a un determinado umbral (ej: el comprometido contractualmente por laTelco),
  4. listar en forma detallada los eventos de no disponibilidad de cada enlace,
  5. se  pueden  excluir  los  eventos  de    no  disponibilidad  demasiado  breves  (ej:<5min).

 

image13

 

Conclusión

 

El servicio IT Metro provisto porU&Rlefacilita a las empresas y organizaciones la

gestiónde losenlaces WANque le son provistos por una TelCo, en particular para

realizar los procesos de:soporte proactivo,verificaciónde losacuerdos de nivel

de servicio(SLAs),planificación de capacidad (capacity planning),detección

yresolucióndeproblemas. De esta manera,  las empresas y organizaciones logran

mejorar el control de lacalidady elcostode dichos enlaces de comunicaciones.

Enviar un comentario