Cómo diseñar y ejecutar un mantenimiento eficaz de armarios rack 19” en CPD, salas técnicas o armarios de comunicaciones: plan preventivo/predictivo, gestión térmica, PDU, UPS/SAI, cableado estructurado, seguridad física y KPIs operativos.

Por qué es crítico el mantenimiento del armario rack

El armario rack 19” concentra activos de misión crítica: servidores, switches, paneles de parcheo, PDUs, UPS/SAI y sensores. Un plan de mantenimiento reduce MTTR, evita paradas, mejora el SLA y alarga la vida útil del hardware.

El enfoque recomendado combina mantenimiento preventivo (tareas periódicas), predictivo (alertas por sensores/telemetría: temperatura, humedad, carga PDU) y correctivo con backout plan para revertir cambios si algo falla.

Entidades y componentes clave del rack 19”

  • Estructura y U disponibles: altura (42U/27U/12U), guías, bandejas, ruedas/niveladores, earthing (puesta a tierra).
  • Gestión térmica: flujo de aire front-to-back, obturadores para blank panels, ventiladores, contención pasillo frío/caliente.
  • Energía: PDU (básica/medida/conmutada), UPS/SAI (autonomía, baterías), ATS, balance de fases, redundancia N+1.
  • Cableado estructurado: cobre Cat6/6A, fibra (LC/SC), patch panels, guías verticales/horizontales, radios de curvatura.
  • Acceso y seguridad física: cerraduras, control de accesos, CCTV, sensores de intrusión y apertura de puerta.
  • Consola y acceso remoto: KVM, módulos serie, IPMI/Redfish; etiquetado TIA-606-B y CMDB.
  • Sensórica: temperatura, humedad, vibración, fugas, humo; integración a DCIM/BMS.

Plan de mantenimiento: periodicidades y tareas

Adapta las tareas a normativa y a tu entorno (TIA-942, ISO/IEC 24764, buenas prácticas ASHRAE). Aquí tienes una base para iniciar.

Tabla 1. Plan preventivo por periodicidad

Periodicidad Tareas clave Responsable Tiempo aprox. Riesgo si se omite
Semanal Lectura de sensores (°C/%RH); revisión alarmas PDU/UPS; inspección visual de LEDs y ventilación frontal/posterior. Operación 15–20 min/rack Sobrecalentamiento no detectado, paradas.
Mensual Limpieza filtrado/paneles ciegos; verificación de par de apriete en bornes accesibles; orden de latiguillos; actualización CMDB/etiquetado. Operación 45–60 min/rack Pérdida de flujo de aire, puntos calientes, errores de desconexión.
Trimestral Prueba funcional UPS (autotest), revisión baterías (fecha/estado); termografía conexiones críticas; test cierre/llaves; limpieza profunda sin ESD. Facilities/IT 1,5–2 h/rack Fallo de respaldo energético y mayor MTTR.
Semestral Comprobación earthing; balance de fases; verificación carga PDU (<80% nominal); revisión ATS; prueba de retorno/rollback en cambios. Eléctrico 2–3 h/conjunto Disparos, caídas por sobrecarga, riesgos eléctricos.
Anual Auditoría TIA-942 (orden, rutas, radios curvatura); pruebas de contingencia (EOP); revisión de inventario, licencias y firmwares; simulacro de fallo. IT + Seguridad Jornada Incumplimiento SLA, tiempos de recuperación elevados.

Gestión térmica y energía: rangos y KPIs

Controlar la temperatura de entrada, la humedad y la carga eléctrica por PDU es esencial para la disponibilidad. Estos rangos se usan comúnmente en CPD; ajústalos a tus políticas internas.

Tabla 2. Parámetros operativos (objetivo)

Parámetro Objetivo recomendado Alarma Métrica/KPI asociado Acción
Temperatura de entrada (front) 18–27 °C > 28 °C o < 15 °C Hotspot ratio; ΔT front/back Mejorar contención/flujo; despejar paneles ciegos
Humedad relativa 20–60 % RH > 65% o < 15% Eventos ESD; corrosión Humidificación/deshumidificación; sellado
Carga PDU por salida < 80% nominal ≥ 90% % utilización / salida Rebalancear equipos, PDU adicional
Carga UPS/SAI 30–70% nominal > 80% Autonomía (min) Añadir capacidad o descargar cargas no críticas
Flujo de aire Front→Back, sin recirculación Pérdida de ΔT Bypass/recirculación (%) Paneles ciegos, tapajuntas y gestión cables

KPIs recomendados

  • % U ocupadas y densidad (kW/rack).
  • % utilización PDU (promedio y pico) y nº disparos de breaker.
  • Incidencias térmicas/mes y tiempo en rango (SLO de temperatura).
  • MTBF/MTTR de componentes críticos (ventiladores, UPS, PDU).

Cableado estructurado y orden

Un cableado ordenado mejora el flujo de aire y acelera el diagnóstico. Aplica TIA-568 y TIA-606-B (etiquetado), respeta radios de curvatura en fibra y usa guías verticales/horizontales y paneles de parcheo adecuados. Documenta en CMDB y actualiza tras cada cambio.

Revisión eléctrica: PDU, UPS/SAI y protecciones

  • PDU inteligentes: monitorización por toma, conmutación remota, umbrales y alarmas (SNMP).
  • UPS/SAI: pruebas de batería, reemplazo según ciclo, verificación de autonomía real y ATS funcional.
  • Protecciones: comprobación de breakers, aprietes, termografía en barras y bornes; balance de fases.
  • Puesta a tierra (earthing): continuidad y resistencias dentro de norma.

Procedimientos (SOP, MOP, EOP) y documentación

Define SOP (procedimientos estándar), MOP (procedimientos de operación/mantenimiento con ventana y riesgo) y EOP (emergencias). Usa control de cambios (ITIL), registra en CMDB y guarda fotos/diagramas antes/después.

Checklist pre/post intervención

Utiliza este checklist resumido para minimizar riesgos durante las tareas de rack.

Tabla 3. Checklist operativo

Fase Comprobaciones Resultado
Antes Ventana aprobada, notificación a interesados; respaldo/rollback definido; EPI y pulsera ESD; herramientas; documentación actualizada. ✅/❌
Durante Bloqueo/etiquetado si aplica; control de cables (sin tensiones); fotos; valores de sensores; medición de carga PDU. ✅/❌
Después Verificación de servicios; lectura final de sensores; cierre de MOP; actualización CMDB/etiquetas; retirada de residuos. ✅/❌

Preguntas frecuentes

¿Cada cuánto debo realizar mantenimiento al rack?

Revisión semanal (sensores/alertas), mensual (limpieza y orden), trimestral (UPS/termografía) y anual (auditoría completa). Ajusta a criticidad y entorno.

¿Qué diferencia hay entre preventivo y predictivo?

El preventivo se basa en calendarios; el predictivo usa telemetría (temperatura, %RH, carga PDU, vibración) para actuar antes del fallo.

¿Cómo evito puntos calientes?

Contención de pasillos, paneles ciegos, orden de cables, sellado y cumplimiento del flujo front-to-back. Reubica equipos si el ΔT es alto.

¿Qué PDUs elegir?

Para racks críticos, PDU medida/conmutada con monitorización por toma, umbrales, logs y soporte a redundancia (A/B).

Compartir esta publicacion

comentarios (0)

No hay comentarios en este momento