Forscher aus dem Vereinigten Königreich hoffen, dass eine neue, öffentlich zugängliche Datenbank, die sie erstellt haben, mit der Zeit kleiner und nicht größer wird. Das liegt daran, dass es sich um ein Kompendium Tausender wenig erforschter Proteine handelt, die von Genen im menschlichen Genom kodiert werden und deren Existenz bekannt ist, deren Funktionen jedoch größtenteils unbekannt sind.
Die als „Unnome“ bezeichnete Datenbank ist das Werk von Matthew Freeman von der Dunn School of Pathology der Universität Oxford, England, und Sean Munro vom MRC Laboratory of Molecular Biology in Cambridge, England, und Kollegen und wird in der Datenbank beschrieben Open-Access-Zeitschrift PLOS-Biologie. Ihre eigenen Untersuchungen einer Untergruppe von Proteinen in der Datenbank zeigen, dass ein Großteil an wichtigen Zellfunktionen beteiligt ist, darunter Entwicklung und Stressresistenz.
Die Sequenzierung des menschlichen Genoms hat deutlich gemacht, dass es Tausende wahrscheinlicher Proteinsequenzen kodiert, deren Identität und Funktion noch unbekannt sind. Dafür gibt es mehrere Gründe, darunter die Tendenz, knappe Forschungsgelder auf bereits bekannte Ziele zu konzentrieren, und das Fehlen von Werkzeugen, einschließlich Antikörpern, um Zellen nach der Funktion dieser Proteine zu befragen. Das Ignorieren dieser Proteine birgt jedoch erhebliche Risiken, argumentieren die Autoren, da wahrscheinlich einige, vielleicht sogar viele, eine wichtige Rolle bei kritischen Zellprozessen spielen und sowohl Erkenntnisse als auch Angriffspunkte für therapeutische Interventionen liefern könnten.
Um eine schnellere Erforschung solcher Proteine zu fördern, erstellten die Autoren die Unnome-Datenbank (www.unknome.org), das jedem Protein eine „Bekanntheits“-Bewertung zuweist, die die Informationen in der wissenschaftlichen Literatur über Funktion, Artenkonservierung, subzelluläre Kompartimentierung und andere Elemente widerspiegelt.
Basierend auf diesem System gibt es viele tausend Proteine, deren Bekanntheit nahe Null liegt. Eingeschlossen sind Proteine aus Modellorganismen sowie solche aus dem menschlichen Genom. Die Datenbank ist für alle offen und anpassbar, sodass der Benutzer verschiedene Elemente mit eigenen Gewichten versehen und so eigene Bekanntheitswerte generieren kann, um seine eigene Forschung zu priorisieren.
Um den Nutzen der Datenbank zu testen, wählten die Autoren 260 Gene beim Menschen aus, für die es bei Fliegen vergleichbare Gene gab und die bei beiden Arten einen Bekanntheitsgrad von 1 oder weniger aufwiesen, was darauf hindeutet, dass über sie fast nichts bekannt war. Für viele von ihnen war ein vollständiger Ausfall des Gens mit dem Leben in der Fliege unvereinbar; Teilweise Knockdowns oder gewebespezifische Knockdowns führten zu der Entdeckung, dass ein großer Teil zu wesentlichen Funktionen beitrug, die Fruchtbarkeit, Entwicklung, Gewebewachstum, Proteinqualitätskontrolle oder Stressresistenz beeinflussen.
Die Ergebnisse deuten darauf hin, dass es trotz jahrzehntelanger detaillierter Studien Tausende von Fliegengenen gibt, die selbst auf der grundlegendsten Ebene noch verstanden werden müssen, und das Gleiche gilt eindeutig für das menschliche Genom. „Diese uncharakterisierten Gene haben ihre Vernachlässigung nicht verdient“, sagte Munro. „Unsere Datenbank bietet eine leistungsstarke, vielseitige und effiziente Plattform zur Identifizierung und Auswahl wichtiger Gene mit unbekannter Funktion für die Analyse und beschleunigt so die Schließung der Lücke im biologischen Wissen, die das Unnom darstellt.“
Munro fügt hinzu: „Die Rolle Tausender menschlicher Proteine bleibt unklar, und doch konzentriert sich die Forschung tendenziell auf diejenigen, die bereits gut verstanden sind. Um dieses Problem anzugehen, haben wir eine Unknome-Datenbank erstellt, die Proteine danach einordnet, wie wenig über sie bekannt ist, und dann.“ führte funktionelle Screenings an einer Auswahl dieser mysteriösen Proteine durch, um zu zeigen, wie Unwissenheit biologische Entdeckungen vorantreiben kann.“
Mehr Informationen:
Rocha JJ, Jayaram SA, Stevens TJ, Muschalik N, Shah RD, Emran S, et al. (2023) Funktionelle Unnomik: Systematisches Screening konservierter Gene unbekannter Funktion, PLoS-Biologie (2023). DOI: 10.1371/journal.pbio.3002222