Informatiker sequenzieren Baumwollgenom

Baumwolle ist die wichtigste Naturfaserquelle auf der Erde, doch nur vier der 50 bekannten Arten eignen sich für die Textilproduktion. Informatiker der DePaul University verwendeten einen Bioinformatik-Workflow, um eines der vollständigsten Genome einer Top-Baumwollart, der in Afrika domestizierten Gossypium herbaceum-Sorte Wagad, zu rekonstruieren. Experten sagen, dass die Ergebnisse den Wissenschaftlern ein umfassenderes Bild davon vermitteln, wie wilde Baumwolle im Laufe der Zeit domestiziert wurde, und möglicherweise dazu beitragen, die Ernte für Landwirte in den USA, Afrika und anderswo zu stärken und zu schützen.

Die Ergebnisse werden in der Zeitschrift veröffentlicht G3-Gene|Genome|Genetik. Thiru Ramaraj, Assistenzprofessor für Informatik am Jarvis College of Computing and Digital Media in DePaul, ist Hauptautor der Publikation. Der technologische Fortschritt im letzten Jahrzehnt ermöglichte es Ramaraj, das Genom in seinem Chicagoer Labor zu analysieren.

„Die Stärke dieser Technologie besteht darin, dass sie es uns ermöglicht, qualitativ hochwertige Genome zu erstellen, die einen Detaillierungsgrad bieten, der vorher einfach nicht möglich war“, sagt Ramaraj, der sich auf Bioinformatik spezialisiert hat. „Dies eröffnet mehr Forschern die Möglichkeit, viele Nutzpflanzen zu sequenzieren, die für die Weltwirtschaft und die Ernährung der Bevölkerung wichtig sind.“

Die Arbeit ist Teil einer Zusammenarbeit, an der Jonathan Wendel, angesehener Professor in der Abteilung für Ökologie, Evolution und Organismenbiologie der Iowa State University, beteiligt ist; und Joshua Udall, Forschungsleiter der Crop Germplasm Research Unit beim Agricultural Research Service des US-Landwirtschaftsministeriums. Laut Udall handelt es sich bei Wagad-Baumwolle um eine diploide Sorte, die überwiegend in afrikanischen Ländern angebaut wird. „Dies hat das Potenzial, eine genetische Karte bereitzustellen, die ihre Baumwollernte verbessern könnte“, sagte Udall.

Fortgeschrittene Computermethoden bringen das Genom voran

Die Arbeit des Teams begann mit der Analyse von DNA-Sequenzdaten. Sie begannen mit der Rekonstruktion des Wagad-Genoms, indem sie hochwertige lange DNA-Sequenzdaten zusammenstellten, die mithilfe der Sequenzierungstechnologie von Pacific Biosciences generiert wurden. Im nächsten Schritt wurden Gesamtgenomkarten von Bionano Genomics verwendet, um die anfängliche Zusammenstellung zu ordnen und auszurichten. Schließlich wurden Hi-C-Sequenzdaten aus der Phase-Genomik verwendet, um ein Genom auf Chromosomenebene zu konstruieren.

Ramaraj wandte sich dann an Azalea Mendoza, eine Doktorandin der Informatik, die auch einen Bachelor-Abschluss in Umweltwissenschaften von DePaul besitzt. „Azalea hatte den biologischen Hintergrund und das Wissen, um in diese Forschung einzutauchen“, sagte Ramaraj.

Mendoza begann damit, die Geschichte der Baumwolle zu erforschen, um „das große Ganze“ zu verstehen. Egal wo Baumwolle angebaut wird, sie wird hauptsächlich zur Fasergewinnung verwendet. Mithilfe der vergleichenden Genomik suchte sie nach Variationen gegenüber ihrem engsten Verwandten und gegenüber einer Fremdgruppe. Mendoza beschäftigte sich auch mit annotierten Genen und notierte ihre Funktionen. „Als wir die Regionen des Genoms untersuchten, fanden wir viele Gene, die mit dem Ballaststoffgehalt zusammenhängen“, sagt Mendoza. „Es war unglaublich, die praktische Anwendung der Arbeit zu sehen.“

Schutz der Pflanzen in den USA und darüber hinaus

Udall, der seit 2015 mit Ramaraj zusammenarbeitet, ist sich der Auswirkungen der Baumwollgenomik auf die US-Landwirtschaft und -Wirtschaft bewusst. Udall leitet die Crop Germplasm Research Unit und untersucht einige der 10.000 Akzessionen verschiedener Arten, die das USDA in seinem Archiv aufbewahrt. Ihr Ziel ist es, die genetische Nahrungs- und Futtermittelsicherheit des Landes aufrechtzuerhalten, und dazu gehört auch das Verständnis der Widerstandsfähigkeit und Schwächen von Nutzpflanzen auf der ganzen Welt.

„Wenn in den USA neue Krankheiten auftreten oder neue invasive Schädlinge auftreten, untersuchen wir als Erstes die genetische Vielfalt der Baumwolle, um festzustellen, ob eine der vorherigen Sorten dagegen resistent ist“, sagt Udall. Dies kann Landwirten die Möglichkeit geben, diese Gene zu kreuzen und moderne Baumwollsorten zu verbessern und so möglicherweise einen katastrophalen Verlust der Landwirtschaft zu vermeiden.

Um diese Arbeit voranzutreiben, verlässt sich Udall auf Computerbiologen wie Ramaraj. Obwohl die Kosten für die Sequenzierung von Genomen gesunken sind, erforderte diese Studie immer noch fast zwei Jahre disziplinübergreifender Arbeit. „Dies ist ein guter Schritt bei der Identifizierung künftiger zu sequenzierender Baumwollgenome“, sagt Udall.

Ramaraj hofft, dass das Projekt andere Lehrkräfte und studentische Mitarbeiter dazu inspirieren wird, sich mit Ideen für Bioinformatikprojekte an CDM zu wenden. Für Mendoza, die jetzt als Absolventin als Datenanalystin arbeitet, inspiriert die Erfahrung in der Bioinformatik bei DePaul ihre Karriereziele.

„Ich liebe Forschung und Arbeit, die mir hilft, auf mehreren Ebenen zu wachsen“, sagt Mendoza. „Das ist die Art von Arbeit, die sich auf die Menschen und die Nachhaltigkeit in der Zukunft auswirken wird.“

Mehr Informationen:
Thiruvarangan Ramaraj et al., Das Genom von Gossypium herbaceum L. Wagad als Ressource zum Verständnis der Domestizierung von Baumwolle, G3-Gene|Genome|Genetik (2022). DOI: 10.1093/g3journal/jkac308

Bereitgestellt von der DePaul University

ph-tech