In einem großen Fortschritt für die Agrarwissenschaft haben Forscher ein neues Rechentool entwickelt, mit dem sich die genetische Vielfalt in DNA-Datenbanken verschiedener Pflanzenarten schnell und effizient aufdecken lässt.
Die Open-Source-Plattform soll die Entdeckung genetischer Variationen beschleunigen, die für die Entwicklung von Nutzpflanzen mit verbesserter Widerstandsfähigkeit, Ertrag und Nährwert von entscheidender Bedeutung sind.
Das KAUST-Team unter der Leitung des Pflanzengenomikers Rod Wing nutzte fortschrittliche Algorithmen und die Fähigkeiten des Hochleistungsrechnens (HPC) und demonstrierte die Fähigkeit des Tools, kleine DNA-Unterschiede – sogenannte Einzelnukleotidvarianten (SNPs) – zwischen verschiedenen Stämmen von zu erkennen Reis, Mais, Sojabohnen und Sorghum.
Im Fall der Reisuntersuchung beispielsweise setzte das Team das Tool auf einen komplexen genetischen Datensatz von DNA-Sequenzen aus Tausenden verschiedener Akzessionen ein – ein umfassendes „Pan-Genom“, das die Forscher zuvor für asiatischen Reis (Oryza) zusammengestellt hatten Sativa).
Mithilfe dieses Datensatzes und der neuartigen Analysemethode der Gruppe entdeckten die KAUST-Forscher mehr als 2 Millionen genetische Varianten, die zuvor bei herkömmlichen Untersuchungen eines einzelnen Referenz-Reisgenoms übersehen wurden.
Dies stellt einen ersten Schritt zur Erschließung neuer Wege in der Pflanzenverbesserung und nachhaltigen Landwirtschaft dar, stellt der Pflanzengenetiker und Co-Autor der Studie Yong Zhou fest. „Diese verborgenen SNPs könnten nun sofort für Züchtungsprogramme und auch zur Identifizierung neuer funktioneller Gene für landwirtschaftliche Merkmale genutzt werden“, sagt er.
Die Entdeckung von SNPs auf diese Weise kann auch dazu beitragen, genetische und evolutionäre Zusammenhänge zwischen verschiedenen Reislinien aufzudecken. Kürzlich leiteten Wing und Zhou die Entwicklung eines hochwertigen Referenzgenoms für roten Hassawi-Reis, eine in Saudi-Arabien beheimatete Kulturpflanze, die für ihre Widerstandsfähigkeit gegenüber lokaler Dürre und hohem Salzgehalt bekannt ist.
Mithilfe des Tools konnten die Forscher eine genetische Verbindung zwischen Hassawi-Reis und einer Untergruppe von Reis herstellen, zu der Sorten mit Ursprung in Australien, Indien und Teilen Südostasiens gehören.
Der Schlüssel zur Leistung des Tools – High Performance Computing Genome Variant Calling Workflow oder HPC-GVCW genannt – ist die Fähigkeit, große Teile des Genoms in diskrete Teile zu unterteilen und sich dann auf parallele Verarbeitungstechnologien zu verlassen, um komplexe Computerprobleme zu lösen groß angelegte mehrdimensionale Genomdaten.
„Dies verkürzt die Ausführungszeit enorm“, sagt der Mitautor der Studie, Nagarajan Kathiresan, ein Informatiker, „und ermöglicht es, 3.000 Genome innerhalb von 24 Stunden zu verarbeiten.“
Da jetzt mehr Genome sequenziert werden als je zuvor, fügt Zhou hinzu, dürfte sich das neue Tool als unschätzbar wertvoll für die Rationalisierung ihrer Analyse erweisen, um die Pflanzenzüchtung der nächsten Generation zu ermöglichen.
Die Arbeit ist veröffentlicht im Tagebuch BMC-Biologie.
Mehr Informationen:
Yong Zhou et al., Ein leistungsstarker Rechenworkflow zur Beschleunigung der GATK-SNP-Erkennung in einem 25-Genom-Datensatz, BMC-Biologie (2024). DOI: 10.1186/s12915-024-01820-5