top of page

Caída global de plataformas por fallo en Google Cloud

Actualizado: 23 jun

El 12 de junio de 2025, millones de usuarios alrededor del mundo se vieron sorprendidos por la caída simultánea de múltiples servicios digitales. El origen del problema fue una interrupción crítica en Google Cloud Platform (GCP), específicamente en su sistema de gestión de identidades y accesos (IAM). Este evento generó errores de autenticación que se propagaron rápidamente, afectando a decenas de plataformas que dependen de GCP para operar.


Caída de Google Cloud

A continuación, desglosamos los detalles clave del incidente y las plataformas comprometidas, así como algunas reflexiones desde la perspectiva de la ciberseguridad.


¿Qué Provocó la Caída de Google Cloud?


El fallo se originó en el componente de IAM (Identity and Access Management) de Google Cloud. Esta infraestructura es esencial para validar y gestionar accesos autenticados entre usuarios y servicios. Un error en este módulo generó una cascada de fallos en tokens de acceso y validaciones de credenciales, lo que resultó en errores como:


"Audiences in JWT are not allowed"

Los sistemas afectados no pudieron autenticar sesiones o peticiones, por lo que simplemente dejaron de responder o expulsaban a los usuarios activos.


Plataformas Digitales Afectadas


La interrupción afectó a múltiples servicios que utilizan Google Cloud como backend o para sus operaciones críticas. Entre las principales plataformas afectadas estuvieron:


  • Spotify

  • Snapchat

  • Discord

  • Twitch

  • Gmail

  • YouTube

  • Google Drive

  • Google Docs y Sheets

  • Google Home

  • Nest (servicios de automatización del hogar)

  • Google Cloud Console

  • Fitbit

  • Airbnb (problemas intermitentes reportados)

  • Waze

  • Uber (segmentos dependientes de GCP)

  • Slack (usuarios con integración vía GCP)


Este evento también afectó a algunos servicios CDN y DNS que gestionaban parte del tráfico, amplificando el impacto.


¿Qué Medidas Tomó Google?


Google reconoció el incidente rápidamente, activando sus protocolos de respuesta a incidentes. Confirmaron que:


  • Identificaron la raíz del fallo en el módulo de IAM.

  • Aplicaron parches de mitigación para estabilizar el entorno.

  • Iniciaron una recuperación progresiva de servicios alrededor de las 3:00 p.m. ET.

  • Publicaron actualizaciones constantes a través de su panel de estado oficial.


Lecciones para la Ciberseguridad


Este incidente deja varias lecciones importantes:


  1. La centralización tiene riesgos: Depender excesivamente de un único proveedor cloud puede aumentar el impacto ante fallos.

  2. Resiliencia distribuida: Diseñar arquitecturas multi-nube o híbridas reduce el riesgo de interrupciones totales.

  3. Monitoreo y alertamiento: Contar con sistemas de alerta temprana puede ayudar a mitigar los efectos en clientes y operaciones.

  4. Gestión de identidades como punto crítico: El IAM se ha convertido en una de las piezas más sensibles de la infraestructura moderna.

  5. Comunicación transparente: Google ofreció actualizaciones en tiempo real, lo cual ayuda a contener el caos y preservar la confianza.


Conclusión


Aunque los servicios han comenzado a restablecerse, este evento es un recordatorio contundente del papel crítico que juega la infraestructura en la nube en nuestra vida digital. También resalta la necesidad de preparar estrategias de contingencia que no solo aborden amenazas externas, sino también errores internos o fallos de configuración.


Si quieres mantenerte al tanto de estos eventos desde una mirada técnica y crítica, no olvides seguir mi blog donde analizamos incidentes reales desde la óptica de la ciberseguridad ofensiva y defensiva.

Comments


Cyberpeace_Mesa de trabajo 1 copia 8.png

Cyberpeace Copyright © 2025 - All rights reserved.

TLP:CLEAR

bottom of page