A mesure que les usages du cloud public se répandent, la question de la maîtrise des coûts liés à ces environnements gagne en acuité. Mais déployer les pratiques FinOps, c’est se frotter à une nouvelle discipline. Avec ses fondamentaux et ses écueils. Enquête auprès de Veolia, SNCF et Société Générale.
Tout commence généralement par une facture. Une facture d’un prestataire cloud synonyme de mauvaise surprise. Les entreprises utilisatrices de cloud connaissent toutes peu ou prou cette expérience qui les amènent à se pencher sur le FinOps, ensemble de pratiques et processus permettant d’optimiser les coûts des services cloud. Reste que cette discipline, à cheval entre le contrôle de gestion et l’architecture IT, est encore relativement jeune pour nombre d’organisations. Comment la déployer efficacement ? ; Par où démarrer ? ; Quelles optimisations se révèlent les plus efficaces ?
Autant de questions que nous avons posées à quatre professionnels qui déploient ou utilisent le FinOps dans leur organisation respective, ainsi qu’à deux consultants.
1) Quand faut-il s’intéresser au FinOps ?
Presque 10 ans déjà que Veolia a pris la décision de migrer massivement vers le cloud public. La conséquence logique ? Le groupe a très tôt été confronté à la question de la maîtrise de ses coûts dans le cloud. « Cette problématique a été prise en compte dès le début, en 2015. Avec des pratiques qui se sont développées au fil du temps, comme le showback (la capacité à exposer aux métiers les coûts générés par leurs consommations de services cloud, NDLR) ou le développement d’un radar FinOps permettant de mettre en évidence les inefficiences dans les usages d’AWS », explique Michel Poulalion, le responsable FinOps et sobriété numérique au sein de la DSI de Veolia. La multinationale a fait le choix de placer le sujet FinOps au sein des équipes techniques, « mais avec l’appui de la finance et du contrôle de gestion ».
Plus récemment concernée par la problématique, la filiale voyages en ligne et technologies de la SNCF (SNCF Connect & Tech) a désormais basculé 230 composants et applications dans le cloud public. Mais l’entreprise s’est lancée dans une démarche de contrôle des coûts bien avant, lors de ses premiers pas sur le cloud public. « Quand nous avons migré notre cloud privé sur le cloud public, d’un coup, nous nous sommes retrouvés face à des factures de 150 à 200 pages que personne ne savait décrypter, se remémore Martin de Roquefeuil, Lead FinOps au sein de SNCF Connect & Tech. Nous avions déjà une culture de refacturation des différents services en interne et le passage au cloud nous offrait l’opportunité de nous montrer plus précis dans cette ventilation des coûts. Mais encore fallait-il être en mesure de le faire ! » C’est dans ce contexte que Martin de Roquefeuil, venu du développement, se positionne sur un poste FinOps ouvert en interne. « J’ai débuté en 2019, avec une petite cinquantaine de projets présents sur le cloud, dont seulement deux étaient réellement critiques. Avec l’accompagnement d’une personne plus expérimentée sur le sujet, ces projets me donnaient de la matière pour travailler en ayant la capacité d’expérimenter et de me tromper, du fait du faible nombre de projets critiques alors exploités sur le cloud. »
Une installation des compétences et pratiques très progressive que décrit aussi la Société Générale. « A partir du moment où l’on engage des dépenses dans le cloud, il peut y avoir quelques surprises sur la facture. Très tôt, une équipe spécialisée a été mise en place pour encadrer et optimiser la consommation », décrit Sylvain Jannot, en charge du pilotage des coûts et de la performance au sein de la direction des infrastructures de la banque. Dans le groupe, la démarche FinOps a été mise en place voici deux ans, d’abord via des optimisations techniques, puis via une acculturation des équipes. « Au départ, le cloud était avant tout considéré comme un levier d’agilité, nous avions donc laissé beaucoup d’autonomie aux différentes équipes sur le FinOps. Dans un second temps, nous avons fait converger une organisation pour déployer des pratiques cohérentes et nous enrichir mutuellement des expériences des uns et des autres », reprend Sylvain Jannot.
Des retours d’expérience qui convergent avec l’avis de Renaud Brosse, senior partner chez Timspirit, pour qui, en matière de FinOps, « nombre d’actions restent d’un accès relativement simple, avec des prérequis limités en termes de cadrage, d’outillage ou de processus. Dès qu’une entreprise dépense plus de 100 000 ou 200 000 euros par an dans le cloud public, des capacités d’optimisation existent, sauf en cas de consommation très monolithique. » Après avoir placé en Open Source un référentiel sur le FinOps né de son expérience chez Veolia, la société Timspirit a créé une communauté FinOps en France (qui compte aujourd’hui 1300 membres), communauté qui a depuis rejoint la FinOps Foundation.
2) Les fondamentaux à installer d’emblée
Démarrer tôt certes, mais par quoi ? Olivier Rafal, directeur de la stratégie conseil de WeEnvision, la branche conseil du groupe SFEIR, conseille d’aborder de front « le volet acculturation – visant à redéfinir la manière dont l’organisation a recours à l’IT au service de la création de valeur – et le volet organisation, incluant l’animation et l’orchestration de la démarche FinOps. » Avec quelques fondamentaux à prendre en compte d’emblée. Comme l’affichage des niveaux de consommation (ou showback), si possible en temps réel. « C’est cet affichage qui permet de faire naître une prise de conscience et d’initier une discussion sur les besoins réels des différents départements », dit Olivier Rafal. Le corollaire ? Cet affichage des coûts passe par la capacité à étiqueter chaque environnement déployé sur le cloud, pour l’associer à un département ou service utilisateur.
Chez Veolia, cette politique dite de tagging a été définie dès 2015, avec systématiquement « trois tags obligatoires correspondant à notre organisation : le département, le service et l’application concernée. Ce sont ces tags qui offrent les axes d’analyse permettant le showback et le chargeback (le refacturation) », précise Michel Poulalion. Même politique de déploiement d’un standard de tagging au sein de la Société Générale : « même si nous n’avons pas normalisé les leviers d’optimisations financières proprement dites – car les contextes sont différents et les mêmes recettes ne peuvent pas s’appliquer partout -, nous souhaitons cependant monitorer la montée en compétences de tous, dans le cadre d’un programme de Go-to-cloud touchant plusieurs milliers d’applications », commente Sylvain Jannot. Au sein de SNCF Connect & Tech, si Martin de Roquefeuil estime que le réel prérequis de toute démarche FinOps consiste d’abord à comprendre les factures et leurs composantes (issues du compute, du trafic, des volumes de stockage et des nombreux à-côtés que décomptent les prestataires), l’organisation a choisi de ventiler ses coûts en couplant la notion de comptes, qui permet de séparer la consommation par grandes entités, avec des tags pour descendre dans un niveau de détails supérieur. « Même si ce choix résulte avant tout de préoccupations relatives à la sécurité », reconnaît le responsable FinOps.
Cette compréhension des logiques de consommation de l’entreprise et des coûts afférents permet en tout cas de se lancer dans les premières logiques d’optimisations. « Les tarifs du cloud résultent de la multiplication de taux tarifaires par des volumes. Et il est possible d’agir sur ces deux leviers », résume Renaud Brosse. Sur les taux, les optimisations passent par l’activation de certaines options offertes par les prestataires : les instances réservées, les plans d’économie, les instances spot… Très rapidement, les entreprises peuvent analyser leurs consommations et identifier les endroits où ces options s’avèrent intéressantes. Concernant les volumes, la priorité consiste, une fois encore, à identifier qui consomme quoi, via une politique de tagging ou via l’exploitation de données techniques, comme celles que renferme une CMDB. « Que ce soit l’un ou l’autre, il faut idéalement déployer cette pratique dès le démarrage d’une migration vers le cloud, et mettre l’information ainsi collectée à la disposition d’un maximum de personnes afin que chacun ait conscience des coûts générés. Ensuite, une dizaine de bonnes pratiques sont disponibles rapidement pour contenir l’envolée des usages : arrêter ce qui peut l’être la nuit et le week-end, s’assurer de la destruction de tout environnement inutile… », reprend le dirigeant de Timspirit. « Fournir un accès simple aux chiffres de consommation et un accompagnement à leur analyse est essentiel », abonde Martin de Roquefeuil.
3) Les premières optimisations
Comprendre les logiques de consommation et de facturation permet donc d’isoler de premières poches d’optimisations. Extinction des environnements inutilisés (en particulier hors production), recours aux leviers d’économies mis en place par les prestataires (instances spots, engagements…), passage à des services managés pour économiser sur les coûts de licences. Les principaux leviers sont connus, mais les résultats dépendent du contexte de chaque entreprise.
« Un des leviers d’optimisation les plus puissants réside dans le recours aux instances spot, des ressources disponibles et en surcapacité que les prestataires proposent à moindre prix », assure de son côté Sylvain Jannot, de la Société Générale. Même si cette arme semble en passe de s’émousser (lire encadré). Chez Veolia, Michel Poulalion souligne, parmi les premières pratiques mises en place, « le développement d’un outil de type scheduler permettant l’arrêt et redémarrage automatique d’instances. » Depuis, AWS propose son propre outil assurant ce type d’optimisation. Chez SNCF Connect & Tech, Martin de Roquefeuil revient sur les premières optimisations déployées en 2019 : « Même si les premiers résultats restent modestes, car il faut d’abord monter en compétences et comprendre les factures, le développement de notre outil interne de contrôle des coûts nous a permis d’identifier de premières pistes d’économie, comme des volumes de stockage inutilisés représentant 10% de la facture d’une ou deux équipes. » Puis la filiale voyages en ligne et technologies de la SNCF a commencé à jouer sur les axes d’engagement de consommation auprès de ses prestataires. « Sur un périmètre correspondant à la moitié de nos factures cloud, nous avons réduit les dépenses d’un tiers environ », dit Martin de Roquefeuil. Qui avertit toutefois des risques à trop se précipiter dans la signature d’engagements. « Les équipes techniques ont tendance à vouloir aller le plus vite possible. Et ces équipes ont encore souvent la culture du capacity planning réalisé à l’année, en intégrant des marges de sécurité. Or, sur le cloud, ce n’est que quand on arrive à l’os qu’on peut se lancer dans la signature d’un engagement », note-t-il.
Selon Olivier Rafal, cette première passe permet d’atteindre des résultats significatifs. « Lors de la mise en place des démarches FinOps, on voit souvent jusqu’à 30 à 50% de dépenses évitées. Mais, fréquemment, ça ne dure pas, car l’argent économisé est réinvesti dans de nouveaux services, qui subiront à leur tour une phase d’optimisation. La courbe des dépenses dans le cloud public suit donc fréquemment une croissance par à-coups », décrit le dirigeant de WeEnvision. Pour Renaud Brosse (Timspirit), le déploiement des pratiques FinOps permet surtout d’éviter les mauvaises surprises sur les factures envoyées par les prestataires : « chez tous nos clients qui ont déployé ce type de pratiques, nous avons assisté à une raréfaction des grosses surprises et dérives sur les factures cloud sur des périodes longues, 12 à 18 mois », assure-t-il.
Pour Olivier Rafal, l’atteinte de cet objectif impose toutefois d’éviter au moins trois chausse-trappes assez classiques dans les projets de migration vers le cloud public. Premier écueil : utiliser le cloud public comme on utilisait l’IT auparavant : « sans à minima quelques efforts de replatforming, le cloud sera forcément plus cher que les infrastructures sur site ! » Seconde erreur : se lancer sans mettre en place d’emblée une politique de tags. « En la matière, le temps perdu ne se rattrape pas », juge le dirigeant de WeEnvision. Enfin, la question du dimensionnement des infrastructures doit être rebalayée, en comprenant finement les besoins des métiers. Par exemple, si une application doit fonctionner un jour par mois, l’entreprise aura tout intérêt à se tourner vers une approche serverless. « Cette réflexion va bien au-delà d’une simple extinction des machines durant la nuit. On parle de réarchitecturer les applications », tranche Olivier Rafal.
Retrouvez la seconde partie de notre enquête sur le déploiement des pratiques FinOps :
Les bonnes pratiques du FinOps, ep. 2 : le contrôle des coûts du cloud au coeur de la culture d’entreprise
Article original à retrouver sur le site de notre publication sœur CIO