A qui appartiennent les données macroéconomiques officielles ?

Covid 19 balance de enero de 2023 un descenso increible

dans le récent débat sur la réforme des retraites, habilement gérée par Gouvernementont surpris les déclarations du Secrétaire d’État à la Sécurité sociale et aux Pensionsdu ministère de l’Inclusion, de la Sécurité sociale et des Migrations à elDiario.es dans lequel il a déclaré : « en toute pudeurqui dispose des meilleures informations pour faire des projections sur les dépenses de retraite, c’est le ministère ».

La phrase a attiré l’attention des économistes pour de nombreuses raisons. Tout d’abord, pour les formes: la arrogance dénotant une phrase qui commence par se vanter de la modestie. Deuxièmement, parce que Une bonne partie des chercheurs en économie pensaient que le fait de disposer de la base de données de l’Échantillon continu des vies actives (MCVL) était plus que suffisant faire toutes les simulations nécessaires et obtenir un projection des dépenses de retraite au moins aussi bon que ce que le gouvernement lui-même peut faire. En définitive, c’est un goûter qui couvre le 4% du total des 20 millions d’affiliés (environ 800 000 individus) et que est pleinement représentatif de la situation de marché du travail passé, présent et futur.

La discussion sur la pérennité du système repose sur une ensemble d’hypothèses, tous discutables et acceptables, sur lesquels une série de scénarios sont élaborés. Bref, une question essentiellement technique que certains tentent de travestir en idéologique, malgré le fait que les fondamentaux de Pacte de Tolède précisément ils ont tenté d’exclure le débat sur les retraites de la lutte partisane et de l’affrontement électoral.

Cependant, le point de départ est que les données MCVL étaient plus que suffisantes pour permettre aux chercheurs de réaliser des projections très rigoureuses. Qu’est-ce donc que « informations supérieures » dont dispose le ministère et qui invalide la qualité de l’analyse des Institut des actuaires espagnols, fédéa, FUNCAS soit Recherche BBVA, qui ont critiqué le projet de réforme sans disposer de ces informations supplémentaires ? Et pourquoi cette information supérieure Seul le ministère l’a?

La troisième raison de surprise est que le ministère avait pris des mesures dans la bonne direction en 2020en créant deux salles de recherche, l’une dans Madrid et un autre dans Barcelonedans le but de faciliter le travail des chercheurs et des universitaires avec des bases de données et des microdonnées du Sécurité sociale. Bien que les conditions soient rigides (demande préalable, associée à un projet de recherche, interdiction d’utiliser tout appareil électronique, impossibilité de télécharger non seulement les données, mais aussi les résultats eux-mêmes, qui seraient transmis par la DSI à l’utilisateur en question, etc.) l’initiative a démontré l’intention du ministère de améliorer l’accessibilité aux données de la Sécurité Sociale.

Cette initiative a ensuite été complétée par la « Portail de données » faciliter l’accès des institutions publiques et privées, non lucratiftant au MCVL qu’au Panel d’entreprises et de travailleurs (PET), même s’il est vrai que le secrétaire d’État à l’origine de ces initiatives a été limogé en juin dernier. S’agit-il maintenant de se tourner vers cette politique d’ouverture aux données les plus difficiles et les plus opaques de l’administration publique espagnole ?

La quatrième raison de m’inquiéter de la phrase malheureuse, celle qui me préoccupe le plus, c’est que rouvre le débat sur qui est le « propriétaire » des données macroéconomiques officielles. Pour moi, cela a été un cheval de bataille permanent dans ma vie professionnelle. Au retour de mon doctorat à l’Université du Minnesota, à la fin des années 80, j’ai été embauché par le ministère de l’Économie et des Finances pour faire partie d’un groupe de macroéconomistes dont l’objectif était de construire un modèle macroéconomique de l’économie espagnole, qui plus tard, il s’appelait le MOÏSE (Modèle de recherche et de simulation de l’économie espagnole). Notre première tâche a été de compiler une base de données macroéconomique annuelle (il n’y avait pas Contabilité nationale (CN) trimestriel) avec la série la plus longue possible (la CN a débuté en 1964).

Une grande partie de ce travail a été résumée dans le livre « L’économie espagnole, 1964-1985. Données, sources et analyse », Instituto de Estudios Fiscales (1987) de Baiges, J., Molinas, C. et Sebastián, M.. le grand historien François Comin nous honora quelques années plus tard de cette critique de notre livre dans le Magazine d’histoire économique: « Il est louable qu’ils proposent gratuitement leurs recherches à d’autres chercheurs, dans une académie où chacun garde ses chiffres jusqu’à ce qu’il présente son analyse finie. Le but des auteurs revus est on ne peut plus louable : présenter des séries longues, des modèles macroéconomiques homogènes, élaborés et reconstruits avec la rigueur nécessaire pour qu’ils soient utiles et fiables ».

Nous avons eu de sérieux problèmes pour préparer cette base de données, bien que faisant partie du ministère de l’Économie et des Finances et ayant le mandat du secrétaire d’État aux Finances de l’époque, Josep Borell. Problèmes découlant de la réticence de nombreux fonctionnaires à partager ou à abandonner « vos données ». Si le tout-puissant ministère de l’Économie et des Finances avait du mal à sortir ces données des tiroirs des fonctionnaires, quelles options auraient un chercheur universitaire ou un simple citoyen ? Pour l’anecdote, je me souviens que la longue série de « faillites et sursis de paiement », qui était nécessaire à notre modèle, n’appartenait qu’à un ancien fonctionnaire de notre propre ministère, qui la gardait jalousement dans un carnet qu’il refusait de donner nous. Après de nombreux cafés, des conversations sur le divin et l’humain, et l’établissement d’une certaine relation de confiance, voire d’amitié, nous avons obtenu le livret tant attendu et avons pu publier la série historique.

La conclusion que nous avons sorti au cours de cette année intense était assez déprimant. L’Espagne n’avait pas encore surmonté bon nombre des tics de l’administration franquistequi a compris deux choses : premièrement, que les données sont dangereuses entre les mains de n’importe qui, et deuxièmement, que la « propriété » des données appartient aux fonctionnaires et/ou à l’État. Pour nous, le fait que les données soient disponibles pour tous les chercheurs était enrichissant, car beaucoup plus d’études pouvaient être menées que l’administration ne peut en mener. Et accroître les connaissances de chacun, y compris l’administration elle-même. C’est-à-dire, une externalité positive a été générée. Nous pensions également que le disponibilité gratuite des données les données macroéconomiques officielles étaient essentielles pour l’analyse et la prise de décisions économiques publiques et privées. Et que, dans une démocratie de qualité, les données appartiennent aux citoyens, pas aux gouvernements.

Avec la révolution technologique, l’apparition d’internet et des réseaux sociaux, on s’attendrait à ce que la disponibilité des données soit beaucoup plus facile et immédiate. Et, en général, ça a été comme ça. Par exemple, la Banque d’Espagne, où j’ai également travaillé de 1990 à 1994, a fait de grands progrès dans la diffusion gratuite et anonyme de ses statistiques. Ce qui, depuis 1991, est offert de façon exemplaire par ses collègues du Banque fédérale de réserve de Saint-Louis (FRED). Actuellement, ils mettent à la disposition des utilisateurs un nombre impressionnant de 819 000 séries chronologiques, tant américaines qu’internationales, et que tout utilisateur peut télécharger gratuitement, de manière anonyme et conviviale.

Les chercheurs et les professeurs bénéficient également de la disponibilité universelle et gratuite de la gigantesque base de données avec un horizon à long terme de la Université d’État de Penn (ancienne base de Summers et Heston), indispensable pour l’estimation des modèles de croissance économique.

Les problèmes avec les données officielles n’ont pas pris fin avec le tournant du siècle. En 2003, étant directeur de la Service de recherche BBVA, j’ai eu une confrontation avec le gouvernement Aznar-Rato, lorsque j’ai dénoncé dans un article le « Blackout statistique » qui avait lieu avec de nombreuses séries macroéconomiques. Un article qui, je le sais, a agacé, et beaucoup, l’équipe du vice-président économique.

Ces dernières années, outre la Banque d’Espagne, la INE Elle a également amélioré son offre statistique, même si l’homogénéité de ses séries longues est parfois remise en cause. Au cours des trois dernières années, j’ai défendu que l’INE aurait dû prendre en charge les statistiques de la pandémie, compte tenu de ses ressources et de son expérience dans la coordination des données des communautés autonomes. Aussi parce qu’ils sont responsables des données démographiques et, au fil du temps, ils auront le dernier mot pour estimer la véritable mortalité de Covid-19 dans notre pays, sur la base de leurs calculs sur la surmortalité au cours de ces années. Mais récemment de la Institut Complutense d’analyse économique (ICAE) nous avons eu un problème avec l’INE, en raison du changement dans la base de données des prix de l’électricité.

Jusqu’en janvier, seuls les tarifs réglementés (PVPC), qui est celui qui avait le plus augmenté en 2022. Cependant, depuis le début de 2023, ils incluent également les prix du marché libre, qui étaient plus stables à la hausse, mais baissent désormais moins que le PVPC, de sorte que le Les séries de l’IPC présentent une discontinuité ingérable pour l’analyse économétrique. Malgré le fait que l’ICAE ait demandé la publication de la série avec l’ancienne méthodologie, au moins les données de liaison, le refus a été retentissant. Personnellement, j’ai été surpris par cette fermeture, étant donné que je défends ardemment notre grand institut de statistique.

Au cours des deux dernières années, j’ai critiqué la faible qualité des données Covid-19 du ministère de la Santé et des Communautés autonomes. J’y consacre même un chapitre (« L’insoutenable légèreté des données Covid en Espagne ») dans le livre « Le virus sans fin » (Penguin Random House, 2022). Dans ce chapitre, j’essaie d’expliquer pourquoi la base de données sur la pandémie en Espagne est l’une des pires au monde, tant en termes de fréquence que de qualité. Il n’y a pas non plus de site pour accéder à de longues séries homogènes et fiables. Et c’est un autre problème dans la fourniture de données publiques dans notre pays. Même là où il est disponible, de nombreuses questions se posent quant à son accessibilité et sa qualité. Souvent, la présentation des données sur les sites Web officiels est confuse et difficile à naviguer. D’autres fois, les données ne sont pas toujours mises à jour assez fréquemment, ce qui rend difficile le suivi des tendances économiques.

Enfin, il reste l’épineuse question de la vie privée et de la sécurité des données des citoyens et des entreprises, ce qui affecte les cas susmentionnés de la Sécurité socialeà ceux du Agence Tributaire et ceux de la Bilan central de la Banque d’Espagne, pour donner quelques exemples. Mais, encore une fois, les nouvelles technologies résolvent le problème, en étant capables d’extraire des échantillons anonymes et représentatifs qui permettent aux chercheurs d’accéder à des données de la plus haute qualité statistique sans mettre en péril la vie privée des citoyens. En d’autres termes, parvenir à un équilibre entre le droit à l’information et la protection des données des citoyens.

Cependant, nous continuons avec le problème de l’accessibilité. La décision d’accorder ou non l’accès à ces échantillons représentatifs reste entre les mains de l’administration et, dans de nombreux cas, un « contact » ou un « ami » est nécessaire pour y parvenir.

La Loi sur la transparence, Accès aux informations publiques et Bon gouvernement stipule que les citoyens ont le droit d’accéder à l’information publiqueet cela devrait être le guide principal du comportement managérial par rapport aux statistiques officielles. Les limites justifiées par des raisons de confidentialité et de sécurité devraient être l’exception et non la règle. Et le principe de base devrait être que les données appartiennent aux citoyens, pas aux gouvernements. En toute modestie.

Suivez les sujets qui vous intéressent

fr-02