Network
Administrator - Monitoreo
El
objetivo del monitoreo es corregir problemas potenciales antes de que
afecten a los usuarios.
Monitoreo
de Windows NT
Performance
Monitor
El Performance Monitor tiene como objeto
la recolección de información para el análisis. Debe
ser utilizado para analizar los servidores con los siguientes objetivos:
* Generar una
Línea Promedio de Comportamiento (Baseline) de cada Servidor
* El almacenamiento en bases de datos de índices de funcionamiento
que permitan un análisis posterior.
Para
efectuar el análisis de cada Servidor, se recomienda configurar
el monitoreo sobre los siguientes objetos:
* System
* Processor
* Memory
* Logical Disk
* Physical Disk (si utiliza RAID)
* Server
* Cache
* Network adapter
* Network segment activity (en al menos un servidor por segmento
en modo promiscuo y no por demasiado tiempo)
Si
se está monitoreando discos con RAID asegurarse de iniciar correctamente
el servicio de monitoreo de discos en modo avanzado.
Para obtener un resultado razonable para el análisis, debe monitorearse
al menos por el término de una semana. Si se están analizando
servidores, el intervalo de monitoreo que debería utilizarse es
de 600 segundos.
El archivo de registro debería ser creado en una computadora diferente
a la que se está monitoreando, o la performance general reflejada
se verá afectada. Se deberá verificar que existan recursos
de disco suficientes para almacenar la información que se registrará.
A través del servicio de Performance Monitor es posible que el
monitoreo se ejecute como servicio, arrancando automáticamente
cuando se inicia el sistema. Esto es altamente recomendable.
Toda la información de monitoreo guardada en archivos log es exportable
a otros formatos de bases de datos, lo cual permite que la información
pueda ser luego manipulada y analizada utilizando formas más complejas
de agrupación, consulta y búsqueda. Aunque independientemente
del método utilizado para el análisis, el tema crucial es
la captura de información en el tiempo y su almacenamiento para
posible análisis posterior.
Monitoreo
de la memoria
El
recurso mas común en ser cuello de botella en NT Server es la memoria,
específicamente la memoria RAM. Si hay una cosa que puede hacerse
para aumentar la performance es agregar más memoria.
La
siguiente lista de contadores permiten determinar si la memoria RAM es
un cuello de botella en el sistema.
| Contador |
Rango
promedio
Aceptable |
Valor
ideal
Alto o Bajo |
Acción |
| Pages/sec |
0-20
|
Bajo
|
Buscar
el o los procesos que están paginando en exceso.
Agregar RAM. |
| Available
Bytes |
Mínimo
4 Mb
|
Alto
|
Ver
los procesos que están usando RAM.
Agregar RAM. |
| Committed
Bytes |
Menos
que la RAM física
|
Bajo
|
Ver
los procesos usando RAM.
Agregar RAM. |
| Pool
Non-paged Bytes |
Mantenerse
estable, sin incrementos.
|
-
|
|
Monitoreo del Procesador
Como
todo lo que ocurre en un Servidor involucra a la CPU, usualmente en un
Servidor de Aplicaciones el procesador está más ocupado
que en un Servidor de Archivos o de Impresión. Como resultado de
esto, el parámetro tomado como uso normal no será el mismo
para un tipo de Servidor que para el otro.
Dos de la causas más comunes de cuellos de botella en el procesador
son las aplicaciones y una cantidad excesiva de interrupciones generadas
por componentes de disco o red.
La
siguiente lista de contadores ayudan a determinar si el procesador puede
ser cuello de botella o no.
|
Contador
|
Rango
promedio Aceptable
|
Valor
ideal Alto
o Bajo
|
Acción
|
| %
Processor Time |
Menor
al 75%
|
Bajo
|
Buscar el o los procesos que están usando en exceso tiempo
de procesador. Actualizar o agregar otro procesador. |
| %
Privileged Time |
Menor
al 75%
|
Bajo
|
Buscar
el o los procesos que están usando en exceso tiempo de procesador.
Actualizar o agregar otro procesador. |
| %
User Time |
Menor
al 75%
|
Bajo
|
Buscar
el o los procesos que están usando en exceso tiempo de procesador.
Actualizar o agregar otro procesador. |
| Interrupts/sec
|
Según
el procesador
|
Bajo
|
Buscar
la placa controladora que está generando interrupciones. |
| System:
Processor Queue Length |
Menos
que 2
|
Bajo
|
Actualizar
o agregar otro procesador. |
| Server
Work Queues: Queue
Length |
Menos
que 2
|
Bajo
|
Buscar
el o los procesos que están usando en exceso tiempo de procesador.
Actualizar o agregar otro procesador. |
Si se detectara que
el procesador es cuello de botella, se puede proceder de la siguiente
forma para resolver el problema:
* Si se trata
de un Servidor de Archivos o de Impresion, actualizar el procesador
por uno más rápido.
* Se se trata de un Servidor de Aplicaciones agregar otro procesador,
especialmente si se trata de aplicaciones preparadas para multiprocesamiento.
* Distribuir cargas pasando funciones, servicios o sistemas a otros
servidores de la red.
Monitoreo de los Discos
Los
discos almacenan los programas y los datos que esos programas procesan.
Cuando se producen demoras en las respuestas de un computador, es posible
que el cuello de botella esté en el disco.
El Performance Monitor viene con contadores tanto para los discos físicos
(PhysicalDisk) como para los discos lógicos (LogicalDisk). LogicalDisk
monitorea las particiones lógicas existentes en los discos físicos.
PhysicalDisk monitorea cada disco físico de forma individual.
Los contadores de disco no vienen habilitados por defecto y deben ser
activados manualmente. Para discos que utilicen RAID se deben activar
en el modo de monitoreo avanzado.
Cuando
se analice la performance y capacidad del subsitema de discos, deben monitorearse
los siguientes contadores para poder determinar si existen cuellos de
botella o no:
|
Contador
|
Rango
promedio Aceptable
|
Valor
ideal Alto
o Bajo
|
Acción
|
| %
Disk Time |
Menor
al 50%
|
Bajo
|
Verifique
si se está paginando.
Actualice el subsistema de discos. |
| Disk
Queue Length |
0-2
|
Bajo
|
Actualice
el subsistema de discos. |
| Avg.
Disk Bytes/Transfer |
Según
el subsistema
|
Alto
|
Actualice
el subsistema de discos. |
|
Disk Bytes/sec |
Según
el subsistema
|
Alto
|
Actualice
el subsistema de discos. |
Si se detectara que
el cuello de botella está en el subsistema de discos, algunas soluciones
posibles pueden ser:
* Agregar una
controladora de discos más rápida, de tipo Fast SCSI-2
o con controlador de cache on-board.
* Agregar más discos cuando se trata de un ambiente RAID.
* Distribuir cargas pasando funciones, servicios o sistemas a otros
servidores de la red.
Monitoreo de la red
Detectar
un cuello de botella en la red, es una de las cosas más complicadas
de lograr dada la complejidad de la mayor parte de las redes existentes
actualmente. Saber que monitorear en una red depende de todo el conjunto
de elementos que la componen. Los objetos detallados a continuación,
son los mas comunmente utilizados para obtener una imagen general de como
se está utilizando la red y serán de gran utilidad al momento
de descubrir un problema.
|
Contador
|
Rango
promedio Aceptable
|
Valor
ideal Alto
o Bajo
|
Acción
|
Server:
Bytes Total/sec |
En
función a la cantidad de tarjetas de red y protocolos utilizados
|
Alto
|
Analizar
más profundamente para determinar la causa del problema.
Agregar otra tarjeta de red. |
Server:
Logon/sec |
-
|
Alto
|
Si
la validación de logon no se completa, agregar BDC adicionales. |
Server:
Logon Total |
-
|
Alto
|
Si
la validación de logon no se completa, agregar BDC adicionales. |
Network
Segment:
% Network utilization |
Generalmente
menor al 30%, aunque puede ser mayor en redes switchadas.
|
Bajo
|
Segmentar
la red.
Limitar los protocolos
en uso. |
Network
Interface:
Bytes Sent/sec |
En
función de la cantidad de placas de red y protocolos utilizados.
|
Alto
|
Actualizar
la placa de red o los componentes de la red física. |
Network
Interface:
Bytes Total/sec
|
En
función de la cantidad de placas de red y protocolos utilizados.
|
Alto
|
Actualizar
la placa de red o los componentes de la red física. |
A través de
estos contadores se puede ver la cantidad de actividad en el servidor
para pedidos de logon y acceso a datos. Si se determinara a traves de
esto u otros contadores, de que el cuello de botella está en la
red, algunas medidas que pueden tomarse son las siguientes:
* Mejorar el
rendimiento del Servidor agregando otra placa de red o actualizando
la actual.
* Verificar y actualizar los componentes físicos como hubs, switchers
o routers.
* Segmentar la red para aislar el tráfico en los segmentos apropiados.
Monitoreo del protocolo NetBEUI
Es
importante además monitorear como NetBEUI afecta a la red, a través
de los broadcasts y las retransmisiones.
|
Contador
|
Rango
promedio Aceptable
|
Valor
ideal Alto
o Bajo
|
Acción
|
| Bytes
Total/sec |
En
función a la cantidad de tarjetas de red y a la carga
|
Alto
|
Actualizar
o agregar otra tarjeta de red. |
| Datagram/sec
|
En
función de la carga
|
Alto
|
Monitorear
los procesos para verificar si están generando una cantidad
excesiva de Datagramas. |
| Frames/sec |
En
función de la carga
|
Alto
|
Reducir
el tráfico de Broadcast. |
Monitoreo del protocolo TCP/IP
Es
importante además monitorear como TCP/IP afecta a la red, a través
de los broadcasts y las retransmisiones.
|
Contador
|
Rango
promedio Aceptable
|
Valor
ideal Alto
o Bajo
|
Acción
|
| TCP
Segments/sec |
En
función de la carga
|
Alto
|
Reducir
el tráfico de Broadcast.
Segmentar la red. |
TCP
Segments
Re-translated |
-
|
Bajo
|
Actualizar
componentes físicos de la red.
Segmentar la red. |
| UDP
Datagrams/sec |
En
función de la carga
|
Bajo
|
Reducir
el tráfico de Broadcast. |
Network
interface:
Outout Queue Length |
Menor
a 2
|
Bajo
|
Actualizar
la tarjeta de red.
Verificar los componentes físicos de la red. |
Event Log
Registra
todos los eventos más significativos en cada Servidor. Si se reciben
alertas, o un Servidor no está funcionando bien, verificar el detalle
de registros en busca de errores. La configuración del Windows
NT Event Log es:
* Event Log size:
512 Kb
* Keep events for 10 days, overwrite as needed
|