Publié le 29-02-2024
Retour

Caractères espace dans les adresses

Bonjour ! 

Je me retrouve face à un problème dans les données de consommation d'énergie à la maille adresse de l'année 2022.  Il semblerait que certaines adresses aient été formatées de telle sorte à ce que des espaces (ou des faux espaces) se soient glissés entre tous les caractères. Ce qui donne ceci : 

2 A V E N U E D E S M A R G U E R I T E S au lieu de 2 AVENUE DES MARGUERITES

ce qui rend difficile la reconstitution de l'historique et le géocodage. 

Avez-vous eu vent de ce problème ? avez vous peut-être des solutions ? ou une mise-à-jour ? 

Bonne journée, 

ZD

Publié par
ZoéD
Catégorie
Questions techniques (API, format fichier...)
Thématiques
Consommation
5 réponse(s)
Agence ORE
Il y a 8 mois 3 semaines

Pourriez-vous svp détailler dans quelle configuration votre problème apparait (format utilisé, etc), pour qu'il soit plus facile de le reproduire ? 

ZoéD
Il y a 8 mois 3 semaines

Bonjour, 

Merci pour votre réponse. Le problème survient dès la visualisation des données brutes sur le site Catalogue Dido | Données et études statistiques (developpement-durable.gouv.fr). Si l'on fait une recherche sur la colonne adresse en notant ' E ' (avec les espaces avant et après la lettre) on retrouve plusieurs exemples. Le problème persiste dans le csv, et dans notre base de données après l'import. 

Enedis Open data
Il y a 8 mois

Bonjour,

Pour pouvoir exploiter les adresses, il faut les normaliser. La normalisation des adresses se fait par l’intermédiaire d'un outil qui se base sur le référentiel postal. Certaines adresses n’ont pas une qualité suffisante pour être normalisées (ex : pas de n° de voie, ou problèmes d’espaces comme mentionné dans la question).

Dans le passé, ces adresses n’étaient pas incluses dans le jeu de données car difficilement exploitables. À la demande du SDES, et dans un souci de complétude, nous avons ajouté les consommations des adresses qui n’ont pas pu être normalisées, ce qui explique que certaines adresses aient une qualité moindre. En revanche, il y a de ce fait plus d’adresses affichées.

Cordialement,
L'équipe Open data d'Enedis
 

yose
Il y a 5 mois

Bonjour.

En comparant les adresses élecs 2022 et 2021, on en retrouve tout de même un nombre conséquent qui était parfaitement "normalisées" en 2021, et que l"on retrouve "espacés" en 2022...

Que s'est-il passé ?!

Exemple:

2022 : 

2 A L L E E D E S P I N S  , BARCELONNETTE   

était bien en 2021:

2 ALLEE DES PINS, BARCELONNETTE

 

 

Enedis Open data
Il y a 5 mois

Bonjour,

Merci pour l'intérêt que vous portez à notre jeu de données. Il s'agit en fait dans ce cas précis de 2 entreprises différentes.

En 2021, l'adresse normalisée est celle d'une entreprise du secteur Tertiaire (Code NAF : 99).
En 2022, l'adresse "espacée" est celle d'une autre entreprise, du secteur Industrie (Code NAF : 10) dont l'adresse a été mal renseignée.

Bien cordialement,
L'équipe Open Data d'Enedis