Einer der schönsten Aspekte der Natur ist die endlose Vielfalt an Formen, Farben und Verhaltensweisen, die Organismen aufweisen. Diese Merkmale helfen Organismen beim Überleben und bei der Partnersuche, so wie der bunte Schwanz eines männlichen Pfaus Weibchen anzieht oder seine Flügel es ihm ermöglichen, vor Gefahren davonzufliegen. Das Verständnis dieser Merkmale ist für Biologen von entscheidender Bedeutung, die sie untersuchen, um zu erfahren, wie sich Organismen entwickeln und an unterschiedliche Umgebungen anpassen.
Dazu müssen Wissenschaftler diese Merkmale zunächst in Worten beschreiben, etwa indem sie sagen, dass der Schwanz eines Pfaus „lebendig, schillernd und verziert“ ist. Dieser Ansatz funktioniert bei kleinen Studien, aber wenn man Hunderte oder gar Millionen verschiedener Tiere oder Pflanzen betrachtet, ist es für das menschliche Gehirn unmöglich, alles im Auge zu behalten.
Computer könnten helfen, aber selbst die neueste KI-Technologie ist nicht in der Lage, die menschliche Sprache in dem Maße zu verstehen, wie es Biologen benötigen. Dies behindert die Forschung erheblich, denn obwohl Wissenschaftler große Mengen an DNA-Daten verarbeiten können, ist es immer noch sehr schwierig, diese Informationen mit körperlichen Merkmalen zu verknüpfen.
Um dieses Problem zu lösen, haben die Forscher Giulio Montanaro und Sergei Tarasov vom Finnischen Naturkundemuseum zusammen mit ihren Kollegen eine spezielle Sprache namens Phenoscript entwickelt. Diese Sprache ist darauf ausgelegt, Merkmale auf eine Weise zu beschreiben, die sowohl Menschen als auch Computer verstehen können. Das Beschreiben von Merkmalen mit Phenoscript ist wie das Programmieren eines Computercodes für das Aussehen eines Organismus.
Phenoscript verwendet eine sogenannte semantische Technologie, die Computern hilft, die Bedeutung hinter Wörtern zu verstehen. Ähnlich wie moderne Suchmaschinen anhand des Kontexts Ihrer Suche den Unterschied zwischen der Frucht „Apfel“ und dem Technologieunternehmen „Apple“ erkennen.
„Diese Sprache wird noch getestet, ist aber sehr vielversprechend. Wenn immer mehr Wissenschaftler Phenoscript verwenden, wird dies die Biologie revolutionieren, indem es riesige Mengen an Merkmalsdaten für groß angelegte Studien verfügbar macht und dem aufstrebenden Bereich der Phänomik Auftrieb verleiht“, erklärt Montanaro.
In ihrer Forschungsartikelneu erschienen im Zeitschrift für BiodiversitätsdatenIn diesem Artikel verwenden die Forscher die neue Sprache zum ersten Mal, um semantische Phänotypen für vier Mistkäferarten der Gattung Grebennikovius zu erstellen. Um die Leistungsfähigkeit des semantischen Ansatzes zu demonstrieren, wenden sie anschließend einfache semantische Abfragen auf die generierten phänotypischen Beschreibungen an.
Schließlich wirft das Team einen weiteren Blick in die Zukunft, um die Art und Weise zu modernisieren, wie Wissenschaftler mit Arteninformationen arbeiten. Ihr nächstes Ziel ist es, semantische Artenbeschreibungen mit dem Konzept der Nanopublikationen zu integrieren, „das diskrete Informationsstücke in einem umfassenden Wissensgraphen zusammenfasst.“
Dadurch können Daten, die Teil dieses Graphen geworden sind, direkt abgefragt werden. Dadurch wird sichergestellt, dass sie durch eine Vielzahl semantischer Ressourcen auffindbar, zugänglich, interoperabel und wiederverwendbar (FAIR) bleiben.
Mehr Informationen:
Giulio Montanaro et al., Berechenbare Artenbeschreibungen und Nanopublikationen: Anwendung ontologiebasierter Technologien auf Mistkäfer (Coleoptera, Scarabaeinae), Zeitschrift für Biodiversitätsdaten (2024). DOI: 10.3897/BDJ.12.e121562