Los servicios relacionados con las tecnologías de la información se han convertido en parte esencial de cualquier negocio moderno, pues son claves para poder competir de forma eficiente en un mercado digitalizado y globalizado, donde diariamente surgen competidores desde cualquier parte del mundo.
El chaos engineering es una nueva disciplina que utilizan muchas empresas para dar respuesta a las necesidades surgidas de la transformación digital, permitiendo que los fallos asociados a la tecnologías IT (information technology) se reduzcan o tengan un menor impacto en el negocio.
Qué es chaos engineering
Podemos definir chaos engineering como una disciplina o técnica cuyo objetivo es identificar y aprender de posibles fallos relacionados con los sistemas informáticos y tecnologías de la información de una empresa.
Esta disciplina está basada en la experimentación para obtener información valiosa de fallos y errores que permitan aplicar correcciones adecuadas para evitar que se cometan en el futuro.
Se trata de una técnica que se aplica a todos los niveles, desde la propia infraestructura IT, hasta los diferentes niveles, como la gestión de software o la ciberseguridad.
Gracias al chaos engineering las empresas pueden evitar caídas masivas de sus servidores, garantizando una mayor disponibilidad de sus servicios y herramientas.
Según el propio manifiesto de Chaos engineering, se trata de una metodología que experimenta sobre sistemas distribuidos con el objetivo de que puedan soportar de manera eficiente condiciones adversas o estresantes, garantizando que el servicio siempre esté disponible para los usuarios.
Cuál es el origen de chaos engineering
Esta disciplina surge de las lecciones aprendidas por la gran empresa de streaming Netflix al realizar un salto de plataforma de sistemas on premise hacia los servicios de AWS (Amazon Web Services) en el año 2010.
Gracias a esta disciplina, Netflix dispone de un control predictivo sobre la experiencia de usuario, incluso cuando algunos de sus elementos clave pudieran venirse abajo (sistemas de recomendaciones, sistema de streaming…).
Cómo se realiza chaos engineering
El concepto de chaos engineering es el de provocar fallos de forma intencionada sobre el sistema o infraestructura TI de la empresa con el objetivo de descubrir errores y situaciones complejas para así disponer de toda la información necesaria para solventarlos.
El concepto de esta metodología es sencillo y se trata de crear un ?caos? en los sistemas intencionadamente para ver cuál es su reacción y cómo se puede volver a un estado de equilibrio.
El objetivo de chaos engineering es encontrar fallos y errores antes de que sucedan en un entorno real, por lo que se dispondrá de parches, protocolos y soluciones para evitar que sucedan o para reaccionar de forma eficiente en caso de que se produzcan.
Cómo implementar chaos engineering
Para poder llevar a cabo esta metodología es necesario tener en cuenta una serie de factores importantes:
- Definir el tipo de situaciones que se van a generar y cómo debería comportarse el sistema ante ellas (elaborar hipótesis).
- Contar con las herramientas y métricas adecuadas que permitan medir los sistemas en condiciones normales y tras provocar los fallos y errores.
- Determinar de forma precisa las distintas acciones y eventos que se implementarán para poner a prueba los sistemas (saturar el número de peticiones a los servidores, sobrepasar la capacidad de almacenamiento, etc.).
- Utilizar aplicaciones de chaos engineering adecuadas para simular eventos y entornos (como las que proporciona la propia AWS).
- Revisar los resultados obtenidos y establecer las mejoras y los protocolos de actuación más eficientes.
Qué ventajas ofrece chaos engineering
Son muchos los beneficios que se obtienen al aplicar la disciplina chaos engineering en una empresa, siendo los más destacados.
Garantizar la calidad del servicio
Con esta metodología se garantiza que los usuarios y clientes de la empresa reciban el mejor servicio posible. La experiencia de usuario será mucho más satisfactoria al recibir servicios y productos de mayor calidad que realmente cumplan con las expectativas y necesidades de los usuarios.
Aumento de los ingresos
Las empresas que utilizan esta disciplina se garantizan mayores ingresos al no perder clientes por situaciones inesperadas que afecten a su infraestructura IT.
Si los servidores de una empresa terminan cayendo u ofreciendo un mal rendimiento, muchos usuarios terminarán abandonando el servicio y optando por una mejor opción en la competencia. Chaos engineering evita esta situación garantizando que los clientes permanezcan suscritos a los servicios del negocio.
Reducción de costes
Se trata de una metodología ideal para optimizar el uso de los recursos IT de la empresa lo que permite ahorrar en costes (por ejemplo, detectando servicios contratados de AWS que realmente no se están utilizando o que no tienen un valor para el negocio).
Hemos hablado sobre chaos engineering, qué es, cómo se aplica esta disciplina y qué beneficios ofrecen a una empresa a la hora de gestionar sus recursos y servicios IT.
Para mejorar el funcionamiento y la disponibilidad de los servicios IT de tu empresa, apostar por chaos engineering es una buena solución siempre que se haga desde un punto de vista controlado.