#22 - La data et l'IA, un atout pour une massification énergétique réussie ?

Rédigé par

Jonathan VILLOT

Maître-Assistant

4957 Dernière modification le 28/09/2021 - 12:33
#22 - La data et l'IA, un atout pour une massification énergétique réussie ?

A l'heure du Big Data[1] et de l'IA[2], l'ouverture en masse des données laisse entrevoir de nombreuses possibilités en faveur de la transition énergétique. L'accès à cette masse d'informations par les acteurs publics comme privés, permet des possibilités d'analyse et de repérage inédites, ouvrant la porte au déploiement d'actions groupées et massifiées. Cet article aborde la data disponible et les premières opportunités qu’elle offre dans une optique de massification de la rénovation énergétique.

 

L’open data en France, quelques éléments de contexte

 

Depuis plusieurs années, sous l’impulsion de la directive INSPIRE et des différentes politiques d’open data, la production de données a augmenté de manière exponentielle. Provenant de différents producteurs (acteurs publics, entreprises, citoyens, …) et obtenues par différentes modalités (capteurs, crowdsourcing, images satellitaires …), elles constituent aujourd’hui ce que certains nomment « l’or noir du XXIième siècle ». A titre d’exemple, la plateforme gouvernementale Datagouv regroupe à ce jour plus de 37 000 jeux de données publiés et enregistrait l’équivalent de 50 millions de pages visitées en 2019[3].

Figure 1: Tableau de bord récapitulant les jeux, ressources et utilisateur  du site et des données présentent sur datagouv (www.datagouv.fr – Consulté le 17/06/2021)

La diversité des données, leur format, les objets qu’elles caractérisent ainsi que leur granularité est aujourd’hui pléthorique. Dans ce magma de données, les ressources et jeux reliés aux bâtiments ne sont pas en reste et ont connu, sur ces deux dernières années, un enrichissement considérable.

Les données sur le parc bâti

Durant de nombreuses années, les jeux de données relatives au parc bâti français demeuraient confidentiels et réservés à quelques ayant-droits. Cet état, de fait, a radicalement changé à partir de 2019 avec l’ouverture en open data de nombreuses bases.

La première « révolution » est venue de la base de Demandes de Valeurs Foncières. Publiée et produite par la Direction Générale des Finances Publiques, cette base capitalise l’ensemble des transactions immobilières intervenues au cours des cinq dernières années. Ces données, issues des actes notariés et localisées à l’adresse, permettent d’obtenir pour chaque logement français les informations relatives à la date de mutation, la nature de la mutation, la surface du logement, ainsi que le prix de vente net vendeur du bien concerné.

La seconde révolution est, quant à elle, intervenue courant 2020, avec l’ouverture en open data de la base des diagnostics de performance énergétique (DPE). Déployée par l’ADEME avec le soutien d’Etalab, la base DPE apporte des informations précises sur plus de 9 millions de diagnostics. La base des DPE comporte de nombreux indicateurs regroupés en trois grands ensembles[4] : les informations clefs, les éléments d’identification, et les éléments techniques. Les informations clefs regroupent les indicateurs relatifs à la performance énergétique (consommation en kwhep/m2/an, étiquette énergie) et environnementale du logement (émissions de gaz à effet de serre en kgeq CO2/m2/an, étiquette GES). Les éléments techniques, quant à eux, précisent les caractéristiques physiques du logement et demeurent la catégorie la plus riche en information. A titre d’exemple, les informations relatives au type de chauffage, aux déperditions, ou encore aux rendements des systèmes y sont renseignées. Enfin, les éléments d’identification contiennent l’ensemble des données relatives à la géolocalisation du logement ou du bâtiment.

L’ouverture des données focalisées sur le parc bâti a continué son essor en 2021. Sans prétendre à l’exhaustivité, le tableau 1 ci-dessous présente une liste des principales bases disponibles à ce jour ainsi qu’une rapide description de leur contenu. A noter que certaines bases référencées peuvent dans certains cas être limitées en termes d’accès et ce du fait de leur caractère confidentiel.

Tableau 1 : Exemples de bases de données caractérisant le parc bâti Français

Nom de la base

Description

Statut

MERIMEE

Mérimée est une base de données du patrimoine monumental et architectural français. Elle caractérise notamment le statut historique ou classé d’un bâtiment

Open data

DVF

Demande de Valeur Foncière des logements

Open data

DPE

Diagnostic de Performance Energétique des logements et bâtiments

Open data

ENEDIS

Données de consommations réelles d’électricité tout usage confondu pour les bâtiments de plus de 10 PDL (Points de livraison)

Open data

GRDF

Données de consommations réelles de gaz tout usage confondu pour les bâtiments de plus de 10 PDL (Points de livraison)

Open data

BDTOPO V3

Description vectorielle et 3D du territoire et notamment des bâtiments. Avec la version V3, certaines données issues des fichiers fonciers ont été intégrées

Open data

RPLS

Répertoire des logements locatifs des bailleurs sociaux

Open data

BAN

Base Adresse Nationale

Open data

Fichiers Fonciers

Les Fichiers fonciers décrivent de manière détaillée le foncier, les locaux ainsi que les différents droits de propriété qui leur sont liés

Accès contraint

RNIC

Le registre des copropriétés recense les copropriétés à usage d’habitat et les caractérise sur plusieurs dimensions

Accès contraint

 

Des données actionnables !

Toutes ces données constituent aujourd’hui une mine d’information considérable. Pour autant, leur usage n’en demeure pas moins complexe et de nombreux verrous nécessitent d’être levés afin de les exploiter pleinement et notamment pour la massification de la rénovation énergétique. En effet, les bases de données ne sont pour la plupart pas initialement pensées pour communiquer entre elles.

La première tâche constitue donc à créer des « passerelles » entre elles afin de formaliser un seul jeu complet. Le plus souvent des techniques d’appariements sémantiques ou géographiques sont utilisées et des compétences en géomatiques et en data science sont alors nécessaires.

Dans un second temps, une procédure de fiabilisation des données appariées est indispensable. Cette fiabilisation peut consister à supprimer des données incohérentes ou encore à définir des règles de priorisation entre les bases de données. A titre d’exemple, l’étiquette énergie d’un bâtiment peut être présente dans plusieurs bases (RNIC et DPE). Selon le millésime et la fiabilité initiale des données contenues dans ces bases, il convient alors de définir quelle donnée sera conservée.

Enfin dans un troisième temps, une tâche importante consiste à compléter les données manquantes. En effet, les données accessibles en open data ne couvrent pas l’ensemble du parc de logements français (9 millions de DPE contre 37 millions de logements en France). Des méthodes de type machine learning ou deep learning sont alors utilisées pour « boucher les trous ». A noter que ces méthodes, bien que performantes, ne sont pas exemptes d’erreurs. De ce fait, la fiabilité des résultats peut être variable selon la nature des données à reconstruire et l’échantillon d’apprentissage utilisé.

Afin de répondre à ces problématiques, plusieurs acteurs français de la Deep Tech et du monde du bâtiment ont travaillé à rendre ces données « actionnables » au travers d’un jeu unique. Nous pouvons à titre d’exemple mentionner les travaux de l’entreprise U.R.B.S[5], du courtier en données namR[6] ou encore du Centre Scientifique et Technique du Bâtiment au travers de son projet GoRénove[7]. Pour autant, rendre la donnée actionnable ne signifie pas forcément qu’elle soit accessible facilement. Il convient donc de la transformer en information interrogeable par tous et ce, du décideur à l’opérationnel.

Des données interrogeables : les exemples du hackaton RenovAction.

Pour que les données puissent être visualisées sans qu’il ne soit nécessaire de les télécharger ou de les manipuler, des solutions innovantes et adaptées aux enjeux de la rénovation énergétique doivent être développées. En juin 2021, le hackaton RénovAction s’est essayé à « aboutir à des solutions innovantes, à de nouveaux usages et nouvelles pratiques de production s’inscrivant dans la rénovation énergétique »[8]. 34 équipes se sont constituées et ont tenté d’apporter des réponses concrètes. Plusieurs projets se sont distingués notamment par leurs interfaces et leur capacité à accélérer la massification de la rénovation énergétique.  L’un des projets, dénommé Mon Coach Renov’, s’est par exemple appuyé sur les données des compteurs Linky afin de permettre une estimation des surconsommations, une différenciation des usages de l’électricité et la mise en avant de solutions d’amélioration énergétique adaptées au contexte du bâtiment. Un second projet dénommé IMOPE s’est, quant à lui, attelé à regrouper, traiter et enrichir l’ensemble des données hétérogènes des bâtiments résidentiels de la ville de Grenoble. Les données DPE enrichies par des algorithmes de machine learning ont été intégrées dans une interface géographique (Figure 2). L’interface réalisée a notamment mis en avant la facilité à repérer en masse les bâtiments présentant des caractéristiques identiques et ce, afin d’organiser de potentiels groupements d’achats.

Figure 2 : Représentation cartographique de l’étiquette énergie (DPE) à l’échelle du bâtiment  et repérage d’adresses répondant à des critères de sélection choisis par l’utilisateur (passoires énergétiques, typologie des ménages, …) (www.imope.fr – Consulté le 18/06/2021)

 

Mi-2021, les données au profit de la rénovation énergétique restent cependant encore peu manipulées et de nombreux usages restent à inventer. Les mois et années à venir devraient voir l’explosion de leur utilisation, permettant ainsi au big data et à l’IA de se positionner comme de véritables atouts pour la massification attendue de la rénovation énergétique.

Un article signé Jonathan VILLOT, Maître Assistant aux Mines Saint-Etienne (https://www.mines-stetienne.fr)

Crédit images ©datagouv.fr / ©URBS

 

[1] Données Massives

[2] Intelligence Artificielle

[3] https://www.data.gouv.fr/fr/posts/retour-sur-les-activites-de-data-gouv-fr-en-2019/

[4]https://www.data.gouv.fr/fr/posts/la-base-des-diagnostics-de-performance-energetique-dpe/

 


Article suivant : #23 - Décret Tertiaire et audits énergétiques : comment passer à l’échelle ? 

Retour à la page d'accueil du dossier

UN DOSSIER RÉALISÉ AVEC LE SOUTIEN DE :

Partager :