Mantenimiento de armarios rack: plan preventivo, checklists y KPIs
- Marlex Conexion
- News
- 0 gustos
- 0 comentarios
Cómo diseñar y ejecutar un mantenimiento eficaz de armarios rack 19” en CPD, salas técnicas o armarios de comunicaciones: plan preventivo/predictivo, gestión térmica, PDU, UPS/SAI, cableado estructurado, seguridad física y KPIs operativos.
Por qué es crítico el mantenimiento del armario rack
El armario rack 19” concentra activos de misión crítica: servidores, switches, paneles de parcheo, PDUs, UPS/SAI y sensores. Un plan de mantenimiento reduce MTTR, evita paradas, mejora el SLA y alarga la vida útil del hardware.
El enfoque recomendado combina mantenimiento preventivo (tareas periódicas), predictivo (alertas por sensores/telemetría: temperatura, humedad, carga PDU) y correctivo con backout plan para revertir cambios si algo falla.
Entidades y componentes clave del rack 19”
- Estructura y U disponibles: altura (42U/27U/12U), guías, bandejas, ruedas/niveladores, earthing (puesta a tierra).
- Gestión térmica: flujo de aire front-to-back, obturadores para blank panels, ventiladores, contención pasillo frío/caliente.
- Energía: PDU (básica/medida/conmutada), UPS/SAI (autonomía, baterías), ATS, balance de fases, redundancia N+1.
- Cableado estructurado: cobre Cat6/6A, fibra (LC/SC), patch panels, guías verticales/horizontales, radios de curvatura.
- Acceso y seguridad física: cerraduras, control de accesos, CCTV, sensores de intrusión y apertura de puerta.
- Consola y acceso remoto: KVM, módulos serie, IPMI/Redfish; etiquetado TIA-606-B y CMDB.
- Sensórica: temperatura, humedad, vibración, fugas, humo; integración a DCIM/BMS.
Plan de mantenimiento: periodicidades y tareas
Adapta las tareas a normativa y a tu entorno (TIA-942, ISO/IEC 24764, buenas prácticas ASHRAE). Aquí tienes una base para iniciar.
Tabla 1. Plan preventivo por periodicidad
| Periodicidad | Tareas clave | Responsable | Tiempo aprox. | Riesgo si se omite |
|---|---|---|---|---|
| Semanal | Lectura de sensores (°C/%RH); revisión alarmas PDU/UPS; inspección visual de LEDs y ventilación frontal/posterior. | Operación | 15–20 min/rack | Sobrecalentamiento no detectado, paradas. |
| Mensual | Limpieza filtrado/paneles ciegos; verificación de par de apriete en bornes accesibles; orden de latiguillos; actualización CMDB/etiquetado. | Operación | 45–60 min/rack | Pérdida de flujo de aire, puntos calientes, errores de desconexión. |
| Trimestral | Prueba funcional UPS (autotest), revisión baterías (fecha/estado); termografía conexiones críticas; test cierre/llaves; limpieza profunda sin ESD. | Facilities/IT | 1,5–2 h/rack | Fallo de respaldo energético y mayor MTTR. |
| Semestral | Comprobación earthing; balance de fases; verificación carga PDU (<80% nominal); revisión ATS; prueba de retorno/rollback en cambios. | Eléctrico | 2–3 h/conjunto | Disparos, caídas por sobrecarga, riesgos eléctricos. |
| Anual | Auditoría TIA-942 (orden, rutas, radios curvatura); pruebas de contingencia (EOP); revisión de inventario, licencias y firmwares; simulacro de fallo. | IT + Seguridad | Jornada | Incumplimiento SLA, tiempos de recuperación elevados. |
Gestión térmica y energía: rangos y KPIs
Controlar la temperatura de entrada, la humedad y la carga eléctrica por PDU es esencial para la disponibilidad. Estos rangos se usan comúnmente en CPD; ajústalos a tus políticas internas.
Tabla 2. Parámetros operativos (objetivo)
| Parámetro | Objetivo recomendado | Alarma | Métrica/KPI asociado | Acción |
|---|---|---|---|---|
| Temperatura de entrada (front) | 18–27 °C | > 28 °C o < 15 °C | Hotspot ratio; ΔT front/back | Mejorar contención/flujo; despejar paneles ciegos |
| Humedad relativa | 20–60 % RH | > 65% o < 15% | Eventos ESD; corrosión | Humidificación/deshumidificación; sellado |
| Carga PDU por salida | < 80% nominal | ≥ 90% | % utilización / salida | Rebalancear equipos, PDU adicional |
| Carga UPS/SAI | 30–70% nominal | > 80% | Autonomía (min) | Añadir capacidad o descargar cargas no críticas |
| Flujo de aire | Front→Back, sin recirculación | Pérdida de ΔT | Bypass/recirculación (%) | Paneles ciegos, tapajuntas y gestión cables |
KPIs recomendados
- % U ocupadas y densidad (kW/rack).
- % utilización PDU (promedio y pico) y nº disparos de breaker.
- Incidencias térmicas/mes y tiempo en rango (SLO de temperatura).
- MTBF/MTTR de componentes críticos (ventiladores, UPS, PDU).
Cableado estructurado y orden
Un cableado ordenado mejora el flujo de aire y acelera el diagnóstico. Aplica TIA-568 y TIA-606-B (etiquetado), respeta radios de curvatura en fibra y usa guías verticales/horizontales y paneles de parcheo adecuados. Documenta en CMDB y actualiza tras cada cambio.
Revisión eléctrica: PDU, UPS/SAI y protecciones
- PDU inteligentes: monitorización por toma, conmutación remota, umbrales y alarmas (SNMP).
- UPS/SAI: pruebas de batería, reemplazo según ciclo, verificación de autonomía real y ATS funcional.
- Protecciones: comprobación de breakers, aprietes, termografía en barras y bornes; balance de fases.
- Puesta a tierra (earthing): continuidad y resistencias dentro de norma.
Procedimientos (SOP, MOP, EOP) y documentación
Define SOP (procedimientos estándar), MOP (procedimientos de operación/mantenimiento con ventana y riesgo) y EOP (emergencias). Usa control de cambios (ITIL), registra en CMDB y guarda fotos/diagramas antes/después.
Checklist pre/post intervención
Utiliza este checklist resumido para minimizar riesgos durante las tareas de rack.
Tabla 3. Checklist operativo
| Fase | Comprobaciones | Resultado |
|---|---|---|
| Antes | Ventana aprobada, notificación a interesados; respaldo/rollback definido; EPI y pulsera ESD; herramientas; documentación actualizada. | ✅/❌ |
| Durante | Bloqueo/etiquetado si aplica; control de cables (sin tensiones); fotos; valores de sensores; medición de carga PDU. | ✅/❌ |
| Después | Verificación de servicios; lectura final de sensores; cierre de MOP; actualización CMDB/etiquetas; retirada de residuos. | ✅/❌ |
Preguntas frecuentes
¿Cada cuánto debo realizar mantenimiento al rack?
Revisión semanal (sensores/alertas), mensual (limpieza y orden), trimestral (UPS/termografía) y anual (auditoría completa). Ajusta a criticidad y entorno.
¿Qué diferencia hay entre preventivo y predictivo?
El preventivo se basa en calendarios; el predictivo usa telemetría (temperatura, %RH, carga PDU, vibración) para actuar antes del fallo.
¿Cómo evito puntos calientes?
Contención de pasillos, paneles ciegos, orden de cables, sellado y cumplimiento del flujo front-to-back. Reubica equipos si el ΔT es alto.
¿Qué PDUs elegir?
Para racks críticos, PDU medida/conmutada con monitorización por toma, umbrales, logs y soporte a redundancia (A/B).
comentarios (0)