Neue Methode zur Identifizierung von Symmetrien in Daten mithilfe der Bayes’schen Statistik

Soul Hackers 2 Erscheinungsdatum Ankuendigungstrailer enthuellt

Ein internationales Forschungsteam unter der Leitung von Wissenschaftlern der Osaka Metropolitan University hat eine Methode entwickelt, um Symmetrien in mehrdimensionalen Daten mit Bayes’schen statistischen Techniken zu identifizieren.

Dieser statistische Ansatz erfordert komplexe Berechnungen von Integralen, die oft nur als Annäherungen betrachtet werden. In ihrer neuen Studie leitete das Forschungsteam erfolgreich neue exakte Integralformeln ab. Ihre Ergebnisse tragen dazu bei, die Genauigkeit von Methoden zur Identifizierung von Datensymmetrien zu verbessern und ihre Anwendungen möglicherweise auf breitere Interessengebiete wie die genetische Analyse auszudehnen.

Symmetrien in der Natur machen die Dinge schön; Symmetrien in Daten machen die Datenverarbeitung effizient. Die Komplexität, solche Muster in Daten zu identifizieren, hat Forscher jedoch schon immer geplagt. Wissenschaftler der Osaka Metropolitan University und ihre Kollegen haben einen großen Schritt in Richtung Erkennung von Symmetrien in mehrdimensionalen Daten gemacht, indem sie die Bayes’sche Statistik verwendet haben. Ihre Ergebnisse wurden in veröffentlicht Die Annalen der Statistik.

Die Bayes’sche Statistik stand in den letzten Jahren aufgrund von Verbesserungen der Computerleistung und ihrer potenziellen Anwendungen in der künstlichen Intelligenz im Rampenlicht. Die Bayes’sche Statistik ist ein statistischer Ansatz, der, selbst wenn die Daten nicht ausreichen, die Wahrscheinlichkeit des Eintretens eines Ereignisses ableitet, indem er zuerst eine vorherige Wahrscheinlichkeit festlegt und dann, wann immer neue Informationen vorliegen, eine spätere Wahrscheinlichkeit – eine Aktualisierung der vorherigen Wahrscheinlichkeit – berechnet, dass die Ereignis wird eintreten. Die Berechnung von A-posteriori-Wahrscheinlichkeiten erfordert komplexe Berechnungen von Integralen und wird daher oft nur als Annäherung betrachtet.

Dem internationalen Team, zu dem Professor Hideyuki Ishi von der Osaka Metropolitan University, Professor Piotr Graczyk von der University of Angers, Professor Bartosz Kołodziejek von der Warsaw University of Technology und die verstorbene Professorin Hélène Massam von der York University (Toronto) gehören, ist es gelungen, neue exakte Integralformeln abzuleiten , und bei der Entwicklung einer Methode zur Suche nach Symmetrien in mehrdimensionalen Daten unter Verwendung von Bayes’schen statistischen Techniken.

Wenn die zu handhabende Datenmenge zunimmt, muss das optimale Muster aus einer großen Anzahl von Mustern ausgewählt werden, was es schwierig macht, das Problem genau zu lösen. Um dieser Herausforderung zu begegnen, hat das Team auch einen effizienten Algorithmus entwickelt, um selbst in solchen Fällen eine Näherungslösung zu erhalten.

Mit den Worten von Professor Ishi: „Symmetrien in Daten sind in einer Vielzahl von Modellen allgegenwärtig. Sobald Symmetrien identifiziert sind, können die Anzahl der Parameter, die erforderlich sind, um die Struktur der Daten darzustellen, und die Anzahl der Stichproben, die erforderlich sind, um die Parameter zu bestimmen erheblich reduziert werden. In Zukunft sollen die Ergebnisse dieser Forschung zur genetischen Analyse beitragen, um Chromosomen zu entdecken, die an verschiedenen Orten die gleiche Funktion haben.“

Mehr Informationen:
Piotr Graczyk et al, Modellauswahl im Raum symmetrieinvarianter Gaußscher Modelle, Die Annalen der Statistik (2022). DOI: 10.1214/22-AOS2174

Bereitgestellt von der Osaka Metropolitan University

ph-tech