L’équipe présente une nouvelle stratégie théorique pour générer des distributions asymétriques en probabilités et en statistiques

Comme on le sait, la distribution normale est un outil clé en probabilités et en statistiques. Il peut être décrit comme une distribution qui obéit à une règle universelle dérivée de l’un des théorèmes les plus importants en probabilité : le théorème central limite, souvent appelé CLT. Plus concrètement, il décrit également comment certaines données se regroupent naturellement autour d’une valeur centrale, dont la forme des histogrammes correspondants (représentant la distribution des données) est une courbe en cloche bien équilibrée.

Certaines données issues de processus du monde réel suivent ce modèle, ce qui fait de la distribution normale une option pour leur analyse. Cependant, la forme idéale en cloche est très inattendue pour la plupart des données. En fait, les données sont parfois biaisées, ce qui signifie que les histogrammes associés sont inclinés d’un côté, à gauche ou à droite. Dans d’autres cas, les données peuvent avoir plusieurs modes (pics) plutôt qu’une valeur centrale. Ces variations rendent la distribution normale moins précise pour analyser de tels ensembles de données.

La théorie mathématique aide à résoudre ces problèmes. En introduisant des ajustements pour l’asymétrie et l’aplatissement, nous pouvons modifier les possibilités de forme de la distribution normale. D’un autre côté, les techniques de transformation peuvent gérer plusieurs modes, offrant ainsi une approche plus flexible. Essentiellement, la théorie mathématique fournit les outils nécessaires pour étendre la distribution normale afin de la rendre plus utile pour différents types de données. Cela améliore la précision des modèles et des prédictions, et donc la prise de décision.

Plusieurs stratégies existent déjà, mais rares sont celles qui peuvent simultanément fausser et ajouter des modes à la distribution normale grâce à une configuration hautement personnalisable. Une telle option est développée dans l’article « Une nouvelle solution mathématique pour créer des distributions continues asymétriques », publié dans la revue Asymétrie.

À l’aide de deux paramètres quasiment libres et d’une fonction intermédiaire très générale, les fondements théoriques et les garanties d’une nouvelle stratégie mathématique sont posés. La clé de cette stratégie réside dans les possibilités infinies de choix de ces composants ; la fonction intermédiaire peut être choisie comme exponentielle, logarithmique, trigonométrique, parmi un large éventail de types fonctionnels. Selon leur nature, diverses formes inclinées à droite, à gauche et multimodales peuvent être atteintes.

Chacune de ces formes peut correspondre aux formes des histogrammes rencontrés dans l’analyse de données réelles. Un autre aspect important de la théorie associée est que la distribution normale peut être remplacée par n’importe quelle distribution avec un support identique, ce qui rend la stratégie adaptable à de nombreux scénarios du monde réel. Ceci est illustré théoriquement dans l’article utilisant la distribution de Cauchy. Avec peu d’effort, il peut également être adapté aux distributions de survie, ouvrant ainsi de nouvelles perspectives bien au-delà de la nature de la distribution normale de base.

Des applications pratiques de cette stratégie théoriquement validée sont actuellement développées avec des données provenant de domaines aussi divers que la biologie, la médecine, l’ingénierie et la finance. Un package R est également en préparation pour le rendre accessible à toute personne traitant des données avec des modèles non standard.

Plus d’informations :
Christophe Chesneau, Une nouvelle stratégie mathématique pour créer des distributions continues asymétriques, Asymétrie (2024). DOI : 10.55092/asymétrie20240003

ph-tech