Publié le
29-02-2024
Retour
Caractères espace dans les adresses
Bonjour !
Je me retrouve face à un problème dans les données de consommation d'énergie à la maille adresse de l'année 2022. Il semblerait que certaines adresses aient été formatées de telle sorte à ce que des espaces (ou des faux espaces) se soient glissés entre tous les caractères. Ce qui donne ceci :
2 A V E N U E D E S M A R G U E R I T E S au lieu de 2 AVENUE DES MARGUERITES
ce qui rend difficile la reconstitution de l'historique et le géocodage.
Avez-vous eu vent de ce problème ? avez vous peut-être des solutions ? ou une mise-à-jour ?
Bonne journée,
ZD
Publié par
ZoéD
Catégorie
Questions techniques (API, format fichier...)
Jeu de données lié
Thématiques
Consommation
Pourriez-vous svp détailler dans quelle configuration votre problème apparait (format utilisé, etc), pour qu'il soit plus facile de le reproduire ?
Bonjour,
Merci pour votre réponse. Le problème survient dès la visualisation des données brutes sur le site Catalogue Dido | Données et études statistiques (developpement-durable.gouv.fr). Si l'on fait une recherche sur la colonne adresse en notant ' E ' (avec les espaces avant et après la lettre) on retrouve plusieurs exemples. Le problème persiste dans le csv, et dans notre base de données après l'import.
Bonjour,
Pour pouvoir exploiter les adresses, il faut les normaliser. La normalisation des adresses se fait par l’intermédiaire d'un outil qui se base sur le référentiel postal. Certaines adresses n’ont pas une qualité suffisante pour être normalisées (ex : pas de n° de voie, ou problèmes d’espaces comme mentionné dans la question).
Dans le passé, ces adresses n’étaient pas incluses dans le jeu de données car difficilement exploitables. À la demande du SDES, et dans un souci de complétude, nous avons ajouté les consommations des adresses qui n’ont pas pu être normalisées, ce qui explique que certaines adresses aient une qualité moindre. En revanche, il y a de ce fait plus d’adresses affichées.
Cordialement,
L'équipe Open data d'Enedis
Bonjour.
En comparant les adresses élecs 2022 et 2021, on en retrouve tout de même un nombre conséquent qui était parfaitement "normalisées" en 2021, et que l"on retrouve "espacés" en 2022...
Que s'est-il passé ?!
Exemple:
2022 :
2 A L L E E D E S P I N S , BARCELONNETTE
était bien en 2021:
2 ALLEE DES PINS, BARCELONNETTE
Bonjour,
Merci pour l'intérêt que vous portez à notre jeu de données. Il s'agit en fait dans ce cas précis de 2 entreprises différentes.
En 2021, l'adresse normalisée est celle d'une entreprise du secteur Tertiaire (Code NAF : 99).
En 2022, l'adresse "espacée" est celle d'une autre entreprise, du secteur Industrie (Code NAF : 10) dont l'adresse a été mal renseignée.
Bien cordialement,
L'équipe Open Data d'Enedis