Jahrhundertelang verließen sich Wissenschaftler auf einen Kugelschreiber oder Bleistift und ein zuverlässiges Laborbuch, um sicherzustellen, dass ihre Experimente von Kollegen verstanden und reproduziert werden konnten. Jetzt, da Experimente Dutzende von Schritten und Hunderte von Materialien umfassen, Gigabyte an Daten produzieren, die Supercomputer zur Verarbeitung erfordern und mit Mitarbeitern auf der ganzen Welt geteilt werden, reicht das Labor-Notebook möglicherweise nicht mehr aus.
In einer kürzlich durchgeführten Studie berichten die Forscher über die Entwicklung einer Online-Plattform, die Genomforschern helfen kann, Experimente von der Konzeption bis zur Veröffentlichung zu verfolgen, genaue Aufzeichnungen für Qualitätskontrollzwecke zu führen und potenzielle Reproduzierbarkeitsbemühungen zu erleichtern.
Das System mit dem Namen „Platform for Epi-Genomic Research“ oder PEGR wurde als Werkzeug entwickelt, um experimentellen Biowissenschaftslaboren – oder Wet Labs – dabei zu helfen, hochkomplexe Vorgänge im Auge zu behalten und Rohdaten in wissenschaftliche Erkenntnisse umzuwandeln. Anstatt sich beispielsweise auf mühsame handgeschriebene Notizen zu verlassen, integriert PEGR zweidimensionale Barcodes – sogenannte Quick-Response- oder QR-Codes –, um detaillierte Informationen zu Proben elektronisch zu sammeln und zu verfolgen, während sie den experimentellen Prozess durchlaufen.
Die Effizienz von PEGR kann die Reproduzierbarkeit verbessern, ein Hauptgrund für die Entwicklung des Werkzeugs, so William Lai, Assistenzprofessor an der Cornell University und früher Assistenzprofessor für Biochemie und Molekularbiologie an der Penn State. Reproduzierbarkeit, ein entscheidender Schritt im wissenschaftlichen Prozess, erfordert, dass Wissenschaftler ihre Arbeit überprüfen, um sicherzustellen, dass sie in realen Anwendungen genau, sicher und funktionsfähig ist.
„Es ist bereits allgemein anerkannt, dass Reproduzierbarkeit nicht nur in den Biowissenschaften ein Thema ist, sondern in allen MINT-Bereichen (Wissenschaft, Technologie, Ingenieurwesen und Medizin),“ sagte Lai. „Es gab eine Geschichte nach der anderen von Forschungsteams, die behaupteten, etwas entdeckt zu haben, und dann, ein paar Jahre später, stellen wir fest, dass niemand diese Ergebnisse außerhalb des Labors, das die Ergebnisse hervorgebracht hat, reproduziert hat. PEGR ist ein Ansatz, um es in den Griff zu bekommen Verfolgen experimenteller Prozesse – was ein Benutzer verwendet und wann er es verwendet – damit wir die Reproduzierbarkeit verbessern können.“
Da es sich um eine Online-Plattform handelt, kann PEGR Wissenschaftler auf der ganzen Welt verbinden, um Reproduzierbarkeitsbemühungen zu erleichtern. Laut Danying Shao, Forschungs- und Entwicklungsingenieur am Institute for Computational and Data, befasst sich die Plattform auch mit der schnellen Entwicklung von Geräten für die Genomforschung – einschließlich Roboterproben und Hochdurchsatz-Sequenzierern, die viele Experimente gleichzeitig durchführen können – die riesige Datenmengen erzeugen Science’s (ICDS) Research Innovations with Scientists and Engineers oder RISE, Team.
„Es besteht kein Zweifel, dass in der Bioinformatik eine Datenexplosion stattfindet“, sagte Shao, der an der Entwicklung der Plattform mitgewirkt hat. „Große Datensätze werden in einem beispiellosen Tempo generiert. Beispielsweise kann eine einzelne Probe Gigabytes an Daten generieren. Und wenn wir Hunderte von Proben sequenzieren, können Sie sehen, dass wir ein Niveau erreichen können, auf dem wir Terabytes von Daten erstellen Daten.“
Laut den Forschern, die Details über das System in veröffentlicht haben GenombiologiePEGR ist integriert mit die Galaxy-Plattform, ein wissenschaftliches Open-Source-Workflow-System. PEGR wurde entwickelt, um das Proben- und Sequenzierungsexperiment zu verfolgen, die Verarbeitung der Daten zu verwalten und dann Berichte und Visualisierungen der experimentellen Ergebnisse zu erstellen.
In den ersten Läufen mit der Plattform erleben die Forscher bereits erste Vorteile.
„Nur als Beispiel: Kürzlich erlebte ein Techniker eine Reihe fehlgeschlagener Experimente, also gingen wir zu PEGR und durch die Untersuchung der experimentellen Metadaten stellten wir fest, dass sie eine schlechte Charge einer bestimmten Chemikalie verwendeten“, sagte Lai. „Nun, historisch gesehen, hätte sich der Prozess, um die Ursache für die fehlgeschlagenen Experimente zu finden, monatelang hinziehen können – wenn nicht, ein oder zwei Jahre – anstatt die Quelle sofort zu finden.“
RISE-basierte Forschung
Laut Chuck Pavloski, Leiter des RISE-Teams, ist das PEGR-Projekt nur ein Beispiel dafür, wie Mitglieder von RISE Forschern der Penn State sowie der Forschungsgemeinschaft insgesamt helfen. Pavloski vergleicht das Team mit einer Verbindung zwischen Forschern mit Computerwerkzeugen und Fachwissen, die die Macht der Wissenschaft erweitern können, um wichtige wissenschaftliche und gesellschaftliche Herausforderungen anzugehen.
„Die RISE-Ingenieure sind effektiv das Bindeglied zwischen der Wissenschaft und den heutigen Rechenanforderungen“, sagte Pavloski. „Mit anderen Worten, sie ermöglichen den Wissenschaftlern, das zu sein, worin sie gut sind. Wir verhalten uns ähnlich wie ein angestellter Wissenschaftler in einem nationalen Labor und ebnen den Weg, damit unsere Wissenschaftler ihre Gebiete erforschen und ihre Forschungsideen verfolgen können .“
Diese von RISE unterstützte Partnerschaft kann Wissenschaftlern bei traditionellen computergestützten Forschungsfragen helfen, wie z. B. die Bereitstellung von Anleitungen zu Best Practices für die Verwendung des Roar-Supercomputers von Penn State, um Wege zur Optimierung und Verbesserung von Code aufzuzeigen, aber das Team kann auch sein eigenes tiefes Verständnis der akademischen Forschung anwenden mit Wissenschaftlern an hochmodernen, interdisziplinären Projekten zusammenarbeiten.
„Das RISE-Team besteht aus Wissenschaftlern auf Master- und Ph.D.-Ebene, die ein tiefes Verständnis dafür haben, wie Wissenschaft funktioniert, aber ständig außerhalb ihres Fachgebiets arbeiten“, sagte Pavloski. „Zum Beispiel haben wir vielleicht einen ausgebildeten Meteorologen, der auch an Biochemie- oder Genomprojekten arbeitet, oder wir haben Ingenieure in unserem Team, die Wissenschaftlern in der Astronomie oder Biochemie helfen können.“
Diese Interdisziplinarität bietet einen weiteren Vorteil. Die Mitglieder des RISE-Teams können die besten Computational Science-Praktiken in einem Bereich für Untersuchungen in anderen Bereichen oder Disziplinen nutzen.
„Wir bieten auch eine starke Verbindung zu neuen Technologien, wie z. B. der Verwendung von Techniken der künstlichen Intelligenz oder der Erforschung der Verwendung von Grafikverarbeitungseinheiten – oder GPU – Berechnungen in einem Forschungsprojekt“, sagte Pavloski.
RISE-Ingenieure arbeiten auch mit Datenvisualisierungsspezialisten zusammen, um Wissenschaftlern dabei zu helfen, überzeugende Visualisierungen für ihre Arbeit zu erstellen und neue immersive Technologien wie Virtual Reality und Augmented Reality zu nutzen, um Daten auf äußerst ansprechende Weise zu untersuchen.
Zukünftige Nutzungen
Die Forscher hoffen, dass PEGR, das Open Source ist, Vorteile für das gesamte wissenschaftliche Unternehmen bringen, Zeit, Geld und Kopfschmerzen sparen und zu allem führen könnte, von einem umfassenderen Verständnis des Genoms bis hin zu besseren medizinischen Behandlungen, die Patienten schneller erreichen.
In Zukunft könnten die Forscher untersuchen, ob die Online-Plattform außerhalb der Verwendung in Nasslaboren und für den Einsatz in der translationalen Wissenschaft erweitert werden kann, was Wissenschaftlern helfen würde, Behandlungen und Lösungen in die reale Welt zu bringen.
„Diese Plattform wurde ursprünglich für die Grundlagenforschung entwickelt, aber wir arbeiten aktiv daran, sie in Zukunft in den translationalen biomedizinischen Bereich zu bringen“, sagte Lai.
Danying Shao et al, PEGR: eine flexible Managementplattform für reproduzierbare epigenomische und genomische Forschung, Genombiologie (2022). DOI: 10.1186/s13059-022-02671-5