🛠️ Mantención Programada: Servidor CP002 (Finalizado)
Resuelto - 04:00 (14/12) 🟢
Finalmente, y tras un extenso trabajo de nuestro staff, hemos logrado corregir y finalizar la reconstrucción del arreglo RAID, restableciendo la seguridad y estabilidad total del servicio.
El servidor ha operado con estabilidad y velocidad normales durante las últimas horas. Asimismo, confirmamos que los respaldos diarios se están ejecutando correctamente en este momento.
Mantendremos un monitoreo permanente sobre el nodo, pero no esperamos nuevos incidentes. Agradecemos su paciencia durante este proceso.
Monitoreando - 23:30 (13/12) 🟡
Hemos estado monitoreando el proceso de Rebuild del RAID y tomando acciones rápidamente ante cualquier problema detectado. Agradecemos su paciencia en este proceso.
Monitoreando - 09:00 (13/12) 🟡
Actualmente, estamos supervisando de cerca el proceso de reconstrucción (rebuild) del arreglo RAID tras el cambio de disco exitoso.
Esto ya que notamos problemas en horario AM.
Servicio Restaurado - 01:40 (13/12) 🟢
Nos complace informar que el Servidor CP002 se encuentra nuevamente en línea y operativo.
Hemos detenido la restauración en el servidor de emergencia (la cual llevaba un 40% de avance) para retomar la operación en el servidor original, que ya cuenta con la unidad NVMe correcta instalada y el arreglo RAID reconstruyéndose con normalidad.
Sobre la demora: El Datacenter nos informó que el técnico original debió abandonar las instalaciones repentinamente por una emergencia personal crítica, lo que obligó a despachar a un segundo técnico para corregir el error y finalizar el cambio de hardware.
Los servicios están subiendo en este momento. Agradecemos enormemente su paciencia ante esta inusual cadena de eventos.
Plan de Contingencia Activado - 23:30 (12/12) 🟠
Debido a que no hemos recibido una respuesta satisfactoria ni inmediata por parte del Datacenter tras el error cometido, hemos decidido no esperar más y activar nuestro procedimiento de emergencia.
Hemos aprovisionado infraestructura nueva y hemos iniciado inmediatamente la restauración de las cuentas utilizando nuestros respaldos externos de JetBackup.
Actualizaremos este reporte y enviaremos una notificación por correo electrónico a todos los clientes alojados en el Servidor CP002 tan pronto tengamos un avance significativo en el porcentaje de restauración.
Actualización Crítica - 22:00 (12/12) 🔴
Lamentablemente, el Datacenter ha cometido un error durante el procedimiento físico e intercambió erróneamente la unidad NVMe incorrecta. Hemos escalado la situación con máxima prioridad a la administración del Datacenter para obtener una rápida solución y rectificación del hardware.
Lamentamos profundamente el tiempo de inactividad extendido en el Servidor CP002. Entendemos la gravedad de la situación y estamos presionando para restablecer el servicio a la brevedad.
---
Hemos actualizado la fecha de la ventana de mantenimiento programado para realizar un reemplazo de hardware prioritario en la unidad de almacenamiento.
Fecha y Hora: Viernes, 12 de Diciembre de 2025 a las 18:00 (GMT-3)
Ventana de Mantenimiento: Aproximadamente 90 minutos.
Servidores/Servicios Afectados:
Impacto Esperado:
Se procederá al cambio de una unidad NVME del arreglo RAID que ha presentado fallos. Aunque hemos reservado una ventana de tiempo amplia por seguridad, esperamos que el tiempo efectivo de desconexión (offline) sea de solo 20 minutos aproximadamente mientras se realiza el cambio y la verificación.
Agradecemos su comprensión mientras trabajamos para mejorar nuestra plataforma.
Finalmente, y tras un extenso trabajo de nuestro staff, hemos logrado corregir y finalizar la reconstrucción del arreglo RAID, restableciendo la seguridad y estabilidad total del servicio.
El servidor ha operado con estabilidad y velocidad normales durante las últimas horas. Asimismo, confirmamos que los respaldos diarios se están ejecutando correctamente en este momento.
Mantendremos un monitoreo permanente sobre el nodo, pero no esperamos nuevos incidentes. Agradecemos su paciencia durante este proceso.
Monitoreando - 23:30 (13/12) 🟡
Hemos estado monitoreando el proceso de Rebuild del RAID y tomando acciones rápidamente ante cualquier problema detectado. Agradecemos su paciencia en este proceso.
Monitoreando - 09:00 (13/12) 🟡
Actualmente, estamos supervisando de cerca el proceso de reconstrucción (rebuild) del arreglo RAID tras el cambio de disco exitoso.
Esto ya que notamos problemas en horario AM.
Servicio Restaurado - 01:40 (13/12) 🟢
Nos complace informar que el Servidor CP002 se encuentra nuevamente en línea y operativo.
Hemos detenido la restauración en el servidor de emergencia (la cual llevaba un 40% de avance) para retomar la operación en el servidor original, que ya cuenta con la unidad NVMe correcta instalada y el arreglo RAID reconstruyéndose con normalidad.
Sobre la demora: El Datacenter nos informó que el técnico original debió abandonar las instalaciones repentinamente por una emergencia personal crítica, lo que obligó a despachar a un segundo técnico para corregir el error y finalizar el cambio de hardware.
Los servicios están subiendo en este momento. Agradecemos enormemente su paciencia ante esta inusual cadena de eventos.
Plan de Contingencia Activado - 23:30 (12/12) 🟠
Debido a que no hemos recibido una respuesta satisfactoria ni inmediata por parte del Datacenter tras el error cometido, hemos decidido no esperar más y activar nuestro procedimiento de emergencia.
Hemos aprovisionado infraestructura nueva y hemos iniciado inmediatamente la restauración de las cuentas utilizando nuestros respaldos externos de JetBackup.
Actualizaremos este reporte y enviaremos una notificación por correo electrónico a todos los clientes alojados en el Servidor CP002 tan pronto tengamos un avance significativo en el porcentaje de restauración.
Actualización Crítica - 22:00 (12/12) 🔴
Lamentablemente, el Datacenter ha cometido un error durante el procedimiento físico e intercambió erróneamente la unidad NVMe incorrecta. Hemos escalado la situación con máxima prioridad a la administración del Datacenter para obtener una rápida solución y rectificación del hardware.
Lamentamos profundamente el tiempo de inactividad extendido en el Servidor CP002. Entendemos la gravedad de la situación y estamos presionando para restablecer el servicio a la brevedad.
---
Hemos actualizado la fecha de la ventana de mantenimiento programado para realizar un reemplazo de hardware prioritario en la unidad de almacenamiento.
Fecha y Hora: Viernes, 12 de Diciembre de 2025 a las 18:00 (GMT-3)
Ventana de Mantenimiento: Aproximadamente 90 minutos.
Servidores/Servicios Afectados:
Servidor CP002Impacto Esperado:
Se procederá al cambio de una unidad NVME del arreglo RAID que ha presentado fallos. Aunque hemos reservado una ventana de tiempo amplia por seguridad, esperamos que el tiempo efectivo de desconexión (offline) sea de solo 20 minutos aproximadamente mientras se realiza el cambio y la verificación.
Agradecemos su comprensión mientras trabajamos para mejorar nuestra plataforma.
