Beh en plus même au delà de ça, c'est quelque chose de vital en réalité, et sur bien des aspects.
On a naturellement tendance à ne pas vouloir toucher à quelque chose qui marche. Le cœur des algorithmes bancaires, de livraison, de logistique routière, de fret, de production d'usine, de régulation de trafic aérien est (ou a été) intouché depuis des dizaines d'années. Pour ces composants extrêmement critiques de notre société moderne, il se trouve que, en gros, plus personne ne sait comment ça marche.
Alors on a fait comme on pouvait, on a foutu ces composants dans des VMs, qu'on a encapsulé dans un sous-réseau particulier, avec un WAF, des proxys logiciels (pour les dates notamment) et du monitoring de partout, bref, on a patché tout le bordel, avec des rustines, et tout le monde prie pour que ça tienne. C'est ce que j'ai déjà vu pour les principales chaînes de production d'une grosse entreprise industrielle : le logiciel cœur de la production qui tourne sur une machine physique sous Windows 95, qu'il ne faut absolument pas éteindre, dont l'unique développeur encore vivant n'a plus aucune idée de comment il a fait et est en retraite depuis 10 ans et n'acceptera aucune somme d'argent pour aider. La mission étant de faire passer cette machine sous Windows Vista. Bisous. (c'est environ là que j'ai décidé que ma carrière professionnelle ne tournerait pas autour des produits Microsoft)
Puis plus on avançait technologiquement, plus l'idée de la qualité et pérennité de ce qui était produit devenait importante. Et ça, c'est comme la sécurité : lorsque tu commences à tirer le fil, tu te rends compte que la pelote c'est toute l'entreprise... La fiabilité et la disponibilité sont des conditions désormais nécessaires à toute nouvelle production. Si Amazon Web Services, par exemple, a si bien marché, c'est parce qu'ils proposent de la disponibilité à cinq 9 ou neuf 9, à des prix défiant toute concurrence, parce qu'ils maîtrisent de bout en bout leur production et sont capables de l'analyser et de modifier n'importe quelle couche, sur des volumes gigantesques. Ce n'est pas pour rien que ces "tests par le chaos" viennent de là.
Il y a un réel besoin de fiabiliser son infrastructure, qu'elle soit physique ou numérique, qu'il n'y avait pas forcément, en matière numérique du moins, il y a 30 ou 40 ans. Ça c'est l'ancien monde.
L'idée d'envisager tous les scénarios n'a rien de nouveau non plus, mais répond à un vrai problème, rencontré de multiples fois, ce qui n'en fait pas quelque chose de "rare", loin de là. Déjà parce que, pour être capable de déterminer si un événement est rare, il faut être capable de l'évaluer. Et du coup on est là face à l'évolution de cette méthodologie : le cerveau humain ne peut pas tout envisager. Il faut créer mieux.
L'impact de cette méthodologie, de créer des pannes de manière aléatoire, se ressent sur la qualité de ce qui est mis en place : on ne doit plus faire face à des problèmes qu'on peut anticiper, mais à une panne qui peut venir de n'importe où. Cela force à augmenter les contrôles, à s'assurer de la bonne marche à tout moment des systèmes, etc. Ce n'est pas juste une infrastructure en production qu'on met à l'épreuve, c'est le niveau de qualité et de fiabilité de la production de bout en bout qu'on augmente.
Le fait est qu'il ne suffit pas de se dire "ça n'arrivera jamais" pour que ça n'arrive pas. Et le problème c'est que lorsqu'on cumule ce que je décris au dessus (un legacy que plus personne ne comprend) avec une mauvaise préparation (par manque de la simple question "et si ça arrive, comment on fait ?"), et bien ça conduit à des catastrophes. Et des catastrophes qui auraient dues être évitées.
Le monde physique et numérique change, il faut le prendre en compte. Avant 2001, le risque de la perte d'un bâtiment entier en plein centre d'affaires était considéré comme négligeable. Les entreprises qui n'ont pas pris en compte ce risque ni prévu de plan de réponse à une catastrophe de cette ampleur ont perdu énormément d'argent et de moyens.
Il faut être inconscient pour se dire que ça n'arrivera plus, et que ce genre de choses ont une si faible probabilité de se passer que, en définitive, ça n'arrivera pas. Là je parle d'attentat, mais on peut aussi imaginer des explosions de centrales nucléaires, des explosions d'usines proches, des crashs d'avions avec tout le personnel qualifié à l'intérieur, etc. comme d'une simple puce qui fond dans un circuit de contrôle de la signalisation ferroviaire. Des choses tellement "impossibles" qu'elles ne se sont jamais produites, n'est-ce pas ?
Du coup heureusement qu'il y a des personnes qui savent dépasser ça et qui sont "ingénieur en super-chef d’une entreprise de taille continentale" ^^
(même si je préférerai ces personnes au service du commun et non d'une entreprise capitaliste, évidemment)