Intervalles de confiance des grandeurs utilisées
Bonjour à toutes et à tous,
Comme j'ai pu le mentionner lors de la masterclass du 17/10, un énorme sujet me semble absent des réflexions sur les données d'énergie : les intervalles de confiance et les marges d'erreurs considérées dans la construction de la plupart des indicateurs publiés. Cela a pu m'échapper mais je n'ai rien lu à ce sujet, même de manière globale. Mettons donc les pieds dans le plat.
Les problèmes de qualité, notamment sur l'exhaustivité et la cohérence, des données sources sont visiblement là pour longtemps. Cela aurait donc dû nous inciter à s'en inquiéter dès les premières publications prévues par la LTECV.
Par exemple, à de multiples endroits et tout au long de l'année, des états des lieux de puissance installées des moyens de productions sont publiés, globaux ou par filières et ce au MW près. Vu les incohérences entre ces différents chiffres, du fait de processus de consolidation qui prennent plusieurs mois, il est impossible d'être précis à l'unité près dans ces cas de figure. Il y a forcément une marge d'erreur qu'il faut préciser.
J'ai ainsi acquis la certitude que les 21 102 MW de puissance éolienne installée annoncés dans le dernier panorama des EnR ne pouvait pas être un chiffre exact. De quel %age doit-il être corrigé ? 0.5%? 1%?
Il doit probablement en être de même pour les chiffres de production/consommation.
Préciser de tels intervalles de confiance n'est pas un aveu d'échec. C'est un signe de salubrité et un pré-requis de rigueur. C'est aussi la moitié du chemin pour régler les problèmes sous-jacents en les rendant visibles. Il sera alors possible de prioriser les travaux à mener pour réduire les intervalles les plus grands si cela était nécessaire.
Si cela est déjà fait en coulisses, il faudrait davantage le mettre en valeur pour sensibiliser les utilisateurs.
Quel est l'avis du SDES sur la question ?
Bonne journée
Le SDES reconnait l'intérêt de d'associer à chaque statistique une mesure de la précision de statistique produite, mais il n'y a pas eu d'investissement méthodologique suffisamment poussé pour pouvoir faire l'objet d'une publication.
Pour les données locales, il n'y a pas de problème d'échantillonnage puisque la couverture est exhaustive. Il peut y avoir par contre des erreurs de mesure et des erreurs sur la labellisation des secteurs.
Bonjour
En effet peu de problèmes d'échantillonnage.
Il peut aussi y avoir des problèmes de traitements ou de complétude de données statiques, comme c'est le cas dans les données référentielles.
Comment pouvons-nous avancer sur le sujet ?