El desrobe tecnológico global mostró cómo estamos un error de distancia de caos
While tal vez no conocías al nombre de CrowdStrike antes, es improbable que lo olvides pronto. Con un solo error en una actualización rutinaria de software, la empresa desencadenaqué quizás la interrupción informática más grande en la historia — creando el tipo de desastre informático que sus productos están diseñados para prevenir.
CrowdStrike dijo que la actualización defectuosa había sido deshierro, pero los problemas que causó no son exactamente las viejas "apagar y encender de nuevo" soluciones que la mayoría de nosotros está acostumbrado. Según informó mi colega Brian Fung, el error que puso a los ordenadores Windows en el modo Blue Screen of Death es reparable. Pero en muchos casos, requiere trabajo minucioso por parte de una persona.
Este momento podría ser un buen momento para comprar a tu personal informático buena café y un bagel espreado, porque cada dispositivo afectado — para algunas organizaciones, estamos hablando de miles — tendrá que ser evaluado por un administrador y reiniciado en modo seguro, y luego se puede eliminar el archivo defectuoso a mano.
“No se puede automatizar eso”, dijo Kevin Beaumont, investigador de seguridad y exanalista de amenazas de Microsoft, en un post en X. “Así que esto va a ser doloroso para los clientes de CrowdStrike”.
Y aunque tu negocio pudiera no haber tenido nada que ver con CrowdStrike, el apagón aún pudo haber ruido tu día.
Pense en un café que utiliza servicios de reservas en línea terceros, contrata las órdenes de entrega y acepta tarjetas de crédito y débito a través de su punto de ventas, que está conectado a sistemas de procesamiento de pagos de fondos. No tuviste que ser un cliente de CrowdStrike para verse afectado por su error, y eso fue lo que hizo que el apagón del viernes fuera tan frustrante.
Habemos tenido interrupciones alarmantes antes, y claramente las habremos tenido de nuevo. Pero la magnitud del apagón de CrowdStrike nuevamente está subrayando cómo se ha vuelto el mundo más interconexo a través de una red casi ninguno de nosotros entendemos y que se auto-regula en gran medida.
“Hay organizaciones a las que estamos fuertemente dependientes las cuales no sabemos hasta qué punto estamos dependientes de ellas hasta que dejan de funcionar”, dijo Stuart Madnick, profesor de informática en la Escuela de Negocios Sloan de la MIT.
Microsoft estimó que el apagón de CrowdStrike afectó a alrededor de 8,5 millones de dispositivos Windows. Se cancelaron 5.000 vuelos en todo el mundo el viernes, mientras que retrasos persistieron a lo largo del fin de semana y hasta el lunes. Los hospitales y servicios gubernamentales fueron reducidos, y en algunas áreas las comunicaciones 911 se detuvieron.
Sería fácil poner toda la culpa en CrowdStrike por su actualización de software desastrosa o en las aerolíneas por no construir protocolos de respaldo robustos o incluso en Microsoft por dominar el mercado informático personal. Sin embargo, los expertos informáticos me dijeron que hay problemas sistémicos en juego aquí.
La naturaleza centralizada de las empresas de seguridad informática significa que ahora tenemos "puntos de fallo grandes", dijo Anil Khurana, director ejecutivo del Centro Baratta para el Negocio Global en la Escuela de Negocios McDonough de Georgetown. “Por sí mismo, eso no es malo, porque la difusión en realidad hace que las diagnósticos sean aún más difíciles”.
Pero las empresas necesitan “un modelo mejor de redundancia operacional y respaldo”, Khurana dijo. “Nuestras plataformas técnicas tienen una mezcla de sistemas de legado acoplados con sistemas modernos, lo que significa que la debilidad determina el rendimiento global del sistema. Lo llamo un 'modelo de casa de cartas'”.
Actualmente, hay medidas de seguridad en lugar, pero los reguladores en todo el mundo han estado durmiendo en el manejo de riesgos de seguridad informática. Las infraestructuras informáticas son infraestructuras críticas, Khurana dijo, lo que sugiere que deben pasar por el mismo tipo de rigor, pruebas y supervisión que vemos para empresas como Boeing o JPMorgan.
Pregunté a Madnick si el mundo debía esperar más interrupciones masivas.
“Este fue bastante malo como es”, dijo. “Puede que sea peor? La respuesta es sí, puede ser peor”.
Aunque la reboot manual de millones de dispositivos sea onerosa y tiempo consumidora, el apagón fue en realidad un error único de una compañía que actuó rápidamente para arreglarlo.
Un malactor podría usar software para "hacer que los ordenadores o otros equipos exploten, estallen o quemaduras — en ese caso, no se reinicia simplemente, está destruido".
OK, así hay una nightmare scenario para hacer que todos deseemos volver a vivir en una cueva. Pero antes de empezar a acumular alimentos enlatados, Madnick tiene otra forma de ver nuestra situación moderna.
“Hay muchas ventajas que estas tecnologías nos dan que realmente valen la pena, el 99% del tiempo”, dijo. La cosa más importante es prepararse para ese 1% de las veces en que las cosas van mal.
Lea también:
- Las ventas de los fabricantes alemanes de automóviles se debilitan
- Emoción por el horario laboral: ¿grabación o flexibilidad?
- Las ofertas anticipadas del Black Friday de Walmart se han puesto hoy en marcha
- Escalada del conflicto: Putin insiste en que Kiev se retire de cuatro regiones y rechace el ingreso en la OTAN