- Case Study in English – Banque des Territoires (CDC Group) x Polyconseil x Hugging Face: Enhancing a Major French Environmental Program with a Sovereign Data Solution
- Case Study in French – Banque des Territoires (Groupe CDC) x Polyconseil x Hugging Face : améliorer un programme environnemental français majeur grâce à une solution data souveraine
Executive summary
The collaboration initiated last January between Banque des Territoires (a part of the Caisse des Dépôts et Consignations group), Polyconseil, and Hugging Face illustrates the opportunity of merging the potential of generative AI with the pressing demands of knowledge sovereignty.
Because the project’s first phase has just finished, the tool developed is ultimately intended to support the national strategy for schools’ environmental renovation. Specifically, the answer goals to optimize the support framework of Banque des Territoires’ EduRénov program, which is devoted to the ecological renovation of 10,000 public school facilities (nurseries, grade/middle/high schools, and universities).
This text shares some key insights from a successful co-development between:
- An information science team from Banque des Territoires’ Loan Department, together with EduRénov’ Director ;
- A multidisciplinary team from Polyconseil, including developers, DevOps, and Product Managers ;
- A Hugging Face expert in Machine Learning and AI solutions deployment.
The facility of RAG to satisfy environmental objectives
Launched by Banque des Territoires (BdT), EduRénov is a flagship program inside France’s ecological and energy transformation strategy. It goals to simplify, support, and finance the energetic renovation of public school buildings. Its ambition is reflected in difficult objectives: assisting 10,000 renovation projects, from nurseries to universities – representing 20% of the national pool of infrastructures – to realize 40% energy savings inside 5 years. Banque des Territoires mobilizes unprecedented means to satisfy this goal: 2 billion euros in loans to finance the work and 50 million euros dedicated to preparatory engineering. After only one 12 months of operation, this system signed nearly 2,000 projects but goals to expand further. As program director Nicolas Turcat emphasizes:
EduRénov has found its projects and cruising speed; now we’ll enhance the connection quality with local authorities while looking for many latest projects. We share a standard conviction with Polyconseil and Hugging Face: the challenge of ecological transition shall be won by scaling up our actions.
The success of the EduRénov program involves quite a few exchanges – notably emails – between experts from Banque des Territoires, Caisse des Dépôts Group (CDC) leading this system, and the communities owning the involved buildings. These interactions are crucial but particularly time-consuming and repetitive. Nonetheless, responses to those emails depend on a big documentation shared between all BdT experts. Subsequently, a Retrieval Augmented Generation (RAG) solution to facilitate these exchanges is especially appropriate.
Because the launch of ChatGPT and the growing craze around generative AI, many firms have been concerned about RAG systems that leverage their data using LLMs via business APIs. Public actors have shown more measured enthusiasm on account of data sensitivity and strategic sovereignty issues.
On this context, LLMs and open-source technological ecosystems present significant benefits, especially as their generalist performances meet up with proprietary solutions currently leading the sphere. Thus, the CDC launched a pilot data transformation project across the EduRénov program, chosen for its operational criticality and potential impact, with an unyielding condition: to ensure the sovereignty of compute services and models used.
Industrializing while ensuring performance and sovereignty
Before starting the project, CDC teams experimented with different models and frameworks, notably using open-source solutions proposed by Hugging Face (Text Generation Inference, Transformers, Sentence Transformers, Tokenizers, etc.). These tests validated the potential of a RAG approach. The CDC, due to this fact, wished to develop a secure application to enhance the responsiveness of BdT’s support to communities.
Given Caisse des Dépôts (CDC) status within the French public ecosystem and the necessity to make sure the solution’s sovereignty and security for manipulated data, the CDC selected a French consortium formed by Polyconseil and Hugging Face. Beyond their respective technical expertise, the complementarity of this collaboration was deemed particularly suited to the project’s challenges.
-
Polyconseil is a technology firm that gives digital innovation expertise through an Agile approach at every stage of technically-intensive projects. From large corporations to startups, Polyconseil partners with clients across all sectors, including ArianeGroup, Canal+, France Ministry of Culture, SNCF, and FDJ. Certified Service France Garanti, Polyconseil has demonstrated expertise in on-premise and cloud deployment (AWS Advanced Tier Services partner and labeled Amazon EKS Delivery, GCP Cloud Architect, Kubernetes CKA certified consultants, etc.). The firm thus possesses all of the crucial resources to deploy large-scale digital projects, with teams composed of Data Scientists, Data Engineers, full-stack/DevOps developers, UI/UX Designers, Product Managers, etc. Its generative AI and LLM expertise is predicated on a dedicated practice: Alivia, through the Alivia App, plus custom support and implementation offers.
-
Founded in 2016, Hugging Face has change into, over time, essentially the most widely used platform for AI collaboration on a world scale. Initially specializing in Transformers and publisher of the famous open-source library of the identical name, Hugging Face is now globally recognized for its platform, the ‘Hub’, which brings together the machine learning community. Hugging Face offers widely adopted libraries, greater than 750,000 models, and over 175,000 datasets able to use. Hugging Face has change into, in just a few years, an important global player in artificial intelligence. With the mission to democratize machine learning, Hugging Face now counts greater than 200,000 every day energetic users and 15,000 firms that construct, train, and deploy models and datasets.
A modular solution to answer a dynamic sector
The imagined solution consists of an application made available to BdT employees, allowing them to submit an email sent by a prospect and routinely generate an appropriate and sourced project response based on EduRénov documentation. The agent can then edit the response before sending it to their interlocutor. This final step enables alignment with the agents’ expectations using a technique corresponding to Reinforcement Learning from Human Feedback (RLHF).
The next diagram illustrates this:
Diagram explanation
- A client sends a request by email through existing channels.
- This request is transferred to the brand new user interface.
- Call to the Orchestrator, which builds a question based on an email for the Retriever.
- The Retriever module finds the relevant contextual elements indexed by their embeddings from the vector database.
- The Orchestrator constructs a prompt incorporating the retrieved context and calls the Reader module by rigorously tracing the documentary sources.
- The Reader module uses an LLM to generate a response suggestion, which is returned to the agent via the user interface.
- The agent evaluates the standard of the response within the interface, then corrects and validates it. This step allows for the gathering of human intelligence feedback.
- The response is transferred to the messaging system for sending.
- The response is delivered to the client, mentioning references to certain sources.
- The client can check with the general public repository of used documentary resources.
To implement this overall process, 4 predominant subsystems are distinguished:
- In green: the user interface for ingesting the documentary base and constituting qualitative datasets for fine-tuning and RLHF.
- In black: the messaging system and its interfacing.
- In purple: the Retrieval Augmented Generation system itself.
- In red: the complete pipeline and the fine-tuning and RLHF database.
Key Success Aspects Success Aspects
The state-of-the-art within the GenAI field evolves at an amazing pace; making it critical to change models during a project without significantly affecting the developed solution. Polyconseil designed a modular architecture where easy configuration changes can adjust the LLM, embedding model, and retrieval method. This lets data scientists easily test different configurations to optimize the answer’s performance. Finally, which means the optimal open and sovereign LLM solution thus far might be available in production relatively simply.
We opted for a modular monolith in hexagonal architecture to optimize the design workload. Nonetheless, because the efficient evaluation of an LLM requires execution on a GPU, we outsourced LLM calls outside the monolith. We used Hugging Face’s Text Generation Inference (TGI), which offers a highly performant and configurable dockerized service to host any LLM available on the Hub.
To make sure data independence and sovereignty, the answer primarily relies on open-source models deployed on a French cloud provider: NumSpot. This actor was chosen for its SecNumCloud qualification, backed by Outscale’s IaaS, founded by Dassault Systèmes to satisfy its own security challenges.
Regarding open-source solutions, many French tools stand out. Particularly, the unicorn Mistral AI is considered one of them, whose Mistral-7B-Instruct-v0.3 model is currently used throughout the system’s Reader. Nonetheless, other more discreet yet specific projects present strong potential to satisfy our challenges, corresponding to CroissantLLM, which we’re evaluating. This model results from a collaboration between the MICS laboratory of CentraleSupélec and Illuin Technology. They aim to offer an ethical, responsible, and performant model tailored to French data.
Organizationally, we formed a single Agile team operating in line with a versatile ScrumBan methodology, complemented by a weekly ritual of monitoring and training on AI breakthroughs. The latter is led by the Hugging Face expert from its Expert Support program. This structure facilitates a smooth transfer of skills and responsibilities to the BdT Data teams while ensuring regular and resilient deliveries amidst project context changes. Thus, we delivered an early naive MVP of the answer and each qualitative and quantitative evaluation notebooks. To this end, we utilize open-source libraries specializing within the evaluation of generative AI systems, corresponding to RAGAS. This serves as the inspiration upon which we iterate latest features and performance improvements to the system.
Final Words from Hakim Lahlou, OLS Groups Innovation and Strategy Director at Banque des Territoires loan department:
We’re delighted to work at Banque des Territoires alongside these experts, renowned each in France and internationally, on a leading edge fully sovereign data solution. Based on this pilot program, this approach opens a brand new pathway: this is probably going how public policies shall be deployed within the territories in the longer term, together with the crucial financing for the country’s ecological and energy transformation. Currently, this approach is the just one that permits massive, efficient, and precise deployment.
Are you involved in a project that has sovereignty challenges? Do you should develop an answer that leverages the capabilities of LLMs? Or do you just have questions on our services or the project? Reach out to us directly at alivia@polyconseil.fr.
If you happen to are concerned about the Hugging Face Expert Support program to your company, please contact us here – our sales team will get in contact to debate your needs!
Résumé
La collaboration lancée en janvier dernier entre la Banque des Territoires de la Caisse des Dépôts et Consignations (CDC), Polyconseil et Hugging Face démontre qu’il est possible d’allier le potentiel de l’IA générative avec les enjeux de souveraineté.
Alors que la première phase du projet vient d’aboutir, l’outil développé doit, à terme, soutenir la stratégie nationale de rénovation environnementale des établissements scolaires. Plus précisément, la solution vise à optimiser le parcours d’accompagnement du Programme EduRénov de la Banque des Territoires (BdT), dédié à la rénovation écologique de 10 000 écoles, collèges et lycées.
Cet article partage quelques enseignements clés d’un co-développement fructueux entre :
- une équipe data science de la Direction des Prêts de la Banque des Territoires ainsi que le Directeur du Programme EduRénov ;
- une équipe pluridisciplinaire de Polyconseil comprenant développeurs, DevOps et Product Manager ;
- un expert Hugging Face en déploiement de solutions de Machine Learning et d’IA.
La puissance du RAG au service d’objectifs environnementaux
Mis en place par la Banque des Territoires, EduRénov est un programme phare de la stratégie de transformation écologique et énergétique française. Il vise à simplifier, accompagner et financer les démarches de rénovation énergétique des bâtiments scolaires publics. L’ambition se traduit par des objectifs exigeants : 10 000 projets de rénovation d’écoles, collèges, lycées, crèches ou universités – soit 20% du parc national – accompagnés afin qu’ils puissent réaliser 40% d’économie d’énergie en 5 ans. Pour y répondre, la Banque des Territoires mobilise des moyens d’motion inédits : une enveloppe de 2 milliards d’euros de prêts pour financer les travaux et 50 thousands and thousands d’euros dédiés à l’ingénierie préparatoire. Après seulement un an d’existence, le programme compte déjà presque 2 000 projets mais conforte les moyens de ses ambitions ; comme le souligne le directeur du programme Nicolas Turcat :
EduRénov a trouvé ses projets et son rythme de croisière, désormais nous allons intensifier la qualité de la relation avec les collectivités tout en allant chercher (beaucoup) de nouveaux projets. Nous portons une conviction commune avec Polyconseil et Hugging Face : le défi de la transition écologique se gagnera par la massification des moyens d’motion.
Le succès du programme EduRénov passe par de nombreux échanges – notamment de courriels – entre les experts de la Banque des Territoires, le Groupe Caisse des Dépôts qui conduit le programme, et les collectivités qui détiennent ce patrimoine à rénover. Ces interactions sont cruciales, mais particulièrement chronophages et répétitives. Néanmoins, les réponses à ces courriels reposent sur une base documentaire large et commune à tous les experts de la BdT. Une solution à base de Retrieval Augmented Generation (RAG) pour faciliter ces échanges est donc particulièrement adaptée.
Depuis le lancement de ChatGPT et le début de l’engouement autour de l’IA générative, de nombreuses entreprises se sont intéressées aux systèmes RAG pour valoriser leurs bases documentaires en utilisant simplement des LLMs via leurs APIs commerciales. Compte tenu de la sensibilité de leurs données et d’enjeux stratégiques de souveraineté, l’enthousiasme est resté plus mesuré du côté des acteurs publics.
Dans ce contexte, les LLMs et les écosystèmes technologiques open source présentent des avantages significatifs, et ce d’autant plus que leurs performances généralistes rattrapent celles des solutions propriétaires, leaders du domaine. C’est ainsi que la CDC a décidé de lancer un projet de transformation data pilote autour du programme EduRénov, choisi pour sa criticité opérationnelle et son impact potentiel, en imposant une condition essentielle : garantir le caractère souverain du cloud et des modèles utilisés dans ce cadre.
Industrialiser en garantissant performance et souveraineté
À la genèse du projet, les équipes de la CDC ont expérimenté avec différents modèles et frameworks, notamment à l’aide des solutions open source proposées par Hugging Face (Text Generation Inference, Transformers, Sentence Transformers, Tokenizers, etc.). Ces tests ont validé le potentiel de l’approche RAG envisagée. La CDC a donc souhaité développer une application sécurisée permettant d’améliorer la réactivité d’accompagnement des collectivités par la Banque des Territoires.
Compte tenu du statut de la Caisse des Dépôts dans l’écosystème public français, et afin de garantir la souveraineté de la solution et la sécurité des données travaillées, elle a choisi de s’orienter vers le groupement français constitué par Polyconseil et Hugging Face. Au-delà des expertises techniques respectives, la complémentarité de cette collaboration a été jugée particulièrement adaptée aux enjeux du projet.
-
Polyconseil est un cabinet d’experts en innovation numérique qui agit de manière Agile sur chaque étape de projets à forte composante technique. Du grand compte à la startup, Polyconseil intervient pour des clients de tous secteurs d’activité, tels que ArianeGroup, Canal+, le Ministère de la Culture, la SNCF, la FDJ, etc. Certifié Service France Garanti, Polyconseil dispose d’une expertise éprouvée sur le déploiement on-premise et sur clouds (AWS Advanced Tier Services partner et labellisé Amazon EKS Delivery, consultants certifiés GCP Cloud Architect, Kubernetes CKA, etc.). Le cabinet possède ainsi l’ensemble des ressources nécessaires au déploiement de projets numériques d’envergure, avec des équipes de Data Scientists, Data Engineers, développeurs full stack /DevOps, UI/UX Designers, Product Managers, etc. L’expertise en matière d’IA générative et de LLM repose sur une practice dédiée : Alivia, au travers de la solution Alivia App et d’offres d’accompagnement et de mise en œuvre sur-mesure.
-
Fondée en 2016, Hugging Face est devenue au fil des années la plateforme la plus utilisée pour la collaboration sur l’Intelligence Artificielle à l’échelle mondiale. Hugging Face, d’abord spécialiste des Transformers et éditeur de la célèbre librairie Open-Source éponyme, est maintenant reconnue mondialement pour sa plateforme, le « Hub », qui rassemble la communauté du machine learning. Proposant à la fois des bibliothèques très largement adoptées, plus de 750 000 modèles, et plus de 175 000 jeux de données (datasets) prêts à l’emploi, Hugging Face est devenue en quelques années un acteur mondial incontournable en intelligence artificielle. Avec pour mission de démocratiser le machine learning, Hugging Face compte aujourd’hui plus de 200 000 utilisateurs actifs quotidiens et 15 000 entreprises qui construisent, entraînent et déploient des modèles et des ensembles de données.
Une solution modulaire pour répondre au dynamisme du secteur
La solution imaginée consiste en une application mise à disposition des collaborateurs de la Banque des Territoires, qui leur permet de soumettre un courriel envoyé par un prospect et de générer automatiquement un projet de réponse adapté et sourcé, basé sur la documentation métier. L’agent peut ensuite éditer la réponse avant de l’envoyer à son interlocuteur. Cette dernière étape permet d’envisager une phase d’alignement aux attentes des agents du système à l’aide grâce à différentes techniques comme “Reinforcement Learning from Human Feedback” (RLHF).
Elle est illustrée par le schéma suivant :
Explication du schéma
- Un client envoie une demande par courriel selon les canaux existants.
- Cette demande est transférée dans la nouvelle interface utilisateur
- Le module Retriever retrouve les éléments de contexte pertinents, indexés par leur embedding, depuis la base de données vectorielle.
- The Retriever module finds the relevant contextual elements indexed by their embeddings from the vector database.
- L’Orchestrateur construit un prompt incorporant le contexte récupéré et appelle le module Reader en retraçant soigneusement les sources documentaires.
- Le module Reader mobilise un LLM pour générer une suggestion de réponse, qui est renvoyée à l’agent via l’interface utilisateur.
- L’agent évalue dans l’interface la qualité de la réponse puis la corrige et la valide. Cette étape permet la collecte de feedback de l’intelligence humaine.
- Transfert au système de messagerie pour envoi.
- La réponse est acheminée au client et mentionne les références à certaines sources.
- Le client peut se référer au référentiel public des ressources documentaires utilisées.
Pour implémenter ce processus d’ensemble on distingue 4 grands sous-systèmes :
- en vert : l’interface d’utilisation, d’ingestion de la base documentaire et de structure des jeux de données qualitatifs pour le fine-tuning et le RLHF.
- en noir : le système de messagerie et son interfaçage.
- en violet : le système Retrieval Augmented Generation proprement dit.
- en rouge : l’ensemble du pipeline et de la base de données de fine-tuning et RLHF.
Facteurs clés de succès
L’état de l’art du domaine évolue à très grande vitesse ; il est donc critique de pouvoir changer de modèles en cours de projet sans remettre en cause significativement la solution développée. Polyconseil a donc conçu une architecture modulaire, dans laquelle le LLM, le modèle d’embedding et la méthode de retrieval peuvent être modifiés par une easy configuration. Ceci permet en outre aux data scientists d’itérer facilement sur différentes configurations pour optimiser la performance de la solution. Cela permet enfin plus globalement de disposer en production et assez simplement de la meilleure solution de LLM à date, ouverte et assurant le caractère souverain.
Dans une optique d’optimisation de la charge de conception, nous avons opté pour un monolithe modulaire en architecture hexagonale. Mais comme l’évaluation efficace d’un LLM demande une exécution sur un GPU nous avons déporté à l’extérieur du monolithe l’appel au LLM. Pour ce faire, nous avons utilisé Text Generation Inference (TGI) d’Hugging Face, qui offre un service dockerisé performant et configurable pour héberger n’importe quel LLM disponible sur le Hub.
Afin de garantir l’indépendance et la souveraineté des données, la solution s’appuie essentiellement sur des modèles open source, déployés sur un fournisseur de Cloud français : NumSpot. Cet acteur a été choisi pour sa qualification SecNumCloud, adossé à l’IaaS Outscale, fondée par Dassault Systèmes pour répondre à ses propres enjeux de sécurité.
Concernant les solutions open source, de nombreux outils français se démarquent. La licorne Mistral AI, dont nous utilisons actuellement le modèle Mistral-7B-Instruct-v0.3, sort notamment du lot. Mais d’autres projets plus discrets mais plus spécifiques présentent un fort potentiel pour répondre à nos enjeux, tels que CroissantLLM que nous évaluons. Ce modèle est issu d’une collaboration entre le laboratoire MICS de CentraleSupélec et Illuin Technology. Il vise à offrir un modèle spécialisé sur des données en français, qui soit éthique, responsable et performant.
Sur le plan organisationnel, nous avons constitué une seule équipe Agile opérant selon une méthodologie de type ScrumBan souple, complétée par un rituel hebdomadaire de veille et de formation sur les avancées de l’IA. Ce dernier est conduit par l’expert Hugging Face du programme Expert Support. Cette organisation facilite un transfert fluide des compétences et des responsabilités vers les équipes Data de la BdT, tout en assurant des livraisons régulières et résilientes aux changements de contexte du projet. Ainsi nous avons livré tôt un MVP naïf de la solution et des notebooks d’évaluations qualitatives et quantitatives. Pour cela, nous utilisons des bibliothèques open source spécialisées dans l’évaluation des systèmes d’IA générative, telles que RAGAS. Ce travail constitue désormais le socle sur lequel nous itérons de nouvelles fonctionnalités et des améliorations de la performance du système.
Le mot de la fin, par Hakim Lahlou, Directeur Innovation et Stratégie Groupes OLS à la Direction des prêts de la Banque des Territoires :
Nous sommes heureux de travailler à la Banque des Territoires aux côtés de ces experts reconnus en France comme à l’international autour d’une solution data très innovante et pleinement souveraine. Sur la base de ce Programme pilote, cette approche ouvre une nouvelle voie : c’est probablement ainsi à l’avenir que se déploieront les politiques publiques dans les territoires ainsi que les financements nécessaires à la Transformation écologique et énergétique du pays. Cette approche est aujourd’hui la seule à permettre des déploiements massifs, efficaces et précis.
Vous êtes concernés par un projet avec des enjeux de souveraineté ? Vous souhaitez mettre au point une solution qui tire profit des capacités des LLMs ? Ou vous avez tout simplement des questions sur nos services ou sur le projet ? Contactez-nous directement à alivia@polyconseil.fr
Si vous êtes intéressé par le programme Hugging Face Expert Support pour votre entreprise, veuillez nous contacter ici – notre équipe commerciale vous contactera pour discuter de vos besoins !
