Ein neues Werkzeug zur Identifizierung langer nichtkodierender RNA von Pflanzen

Lange nichtkodierende RNAs (lncRNAs) sind allgegenwärtige Transkripte mit entscheidender regulatorischer Rolle in verschiedenen biologischen Prozessen, einschließlich Chromatin-Remodellierung, posttranskriptioneller Regulation und epigenetischen Modifikationen. Während immer mehr Belege die Mechanismen aufklären, durch die pflanzliche lncRNAs Wachstum, Wurzelentwicklung und Samenruhe modulieren, bleibt ihre genaue Identifizierung aufgrund des Mangels an pflanzenspezifischen Methoden eine Herausforderung.

Derzeit werden die gängigen Methoden zur Identifizierung pflanzlicher lncRNA größtenteils auf der Grundlage menschlicher oder tierischer Datensätze entwickelt. Folglich wurde die Genauigkeit und Wirksamkeit dieser Methoden bei der Vorhersage pflanzlicher lncRNAs noch nicht vollständig bewertet.

Kürzlich erschien ein Forschungsartikel mit dem Titel „Plant-LncPipe: Eine Computerpipeline, die eine signifikante Verbesserung der lncRNA-Identifizierung von Pflanzen ermöglicht“ von einer Gruppe unter der Leitung von Jian-Feng Mao von der Beijing Forestry University und der Universität Umeå veröffentlicht In Gartenbauforschung.

Diese Studie sammelte umfassend hochwertige RNA-Sequenzierungsdaten aus verschiedenen Pflanzen und nutzte diese pflanzenspezifischen Daten, um die Modelle von drei gängigen lncRNA-Vorhersagetools, nämlich CPAT, LncFinder und PLEK, neu zu trainieren. Die Leistung der neu trainierten Modelle wurde mit anderen gängigen lncRNA-Vorhersagetools wie CPC2, CNCI, RNAplonc und LncADeep verglichen und bewertet.

Die Ergebnisse zeigten, dass die neu trainierten Modelle die Vorhersageleistung für pflanzliche lncRNAs deutlich verbesserten. Unter ihnen übertrafen zwei umgeschulte Modelle, LncFinder-plant und CPAT-plant, andere bei mehreren Bewertungsmetriken und machten sie zu den am besten geeigneten Werkzeugen für die Identifizierung pflanzlicher lncRNA.

Diese Forschung entwickelte eine Computerpipeline namens Plant-LncPipe zur Identifizierung und Analyse pflanzlicher lncRNAs.

Diese Pipeline integriert zwei leistungsstärkste Identifikationsmodelle, CPAT-plant und LncFinder-plant, und ermöglicht einen umfassenden Berechnungsprozess, der Rohdatenvorverarbeitung, Transkriptassemblierung, lncRNA-Identifizierung, lncRNA-Klassifizierung und lncRNA-Ursprünge umfasst. Diese rechnerische Pipeline kann in großem Umfang auf verschiedene Pflanzenarten angewendet werden. Plant-LncPipe ist Öffentlich verfügbar.

Die Studie zeigt, dass die Umschulung von lncRNA-Vorhersagemodellen anhand hochwertiger transkriptomischer Pflanzendaten eine genauere Erfassung pflanzlicher lncRNA-Merkmale ermöglichte und die Vorhersagegenauigkeit und -zuverlässigkeit deutlich verbesserte. Die Studie unterstrich die Bedeutung einer artspezifischen Umschulung zur Verbesserung der Modellgenauigkeit. Durch die Neuausrichtung vorhandener ausgereifter Modelle wurden zuvor gesammelte Erfahrungen und Methoden beibehalten und gleichzeitig die Anwendbarkeit und Genauigkeit des Modells weiter gesteigert.

Mehr Informationen:
Xue-Chan Tian et al, Plant-LncPipe: eine rechnerische Pipeline, die eine signifikante Verbesserung bei der Identifizierung pflanzlicher lncRNA bietet, Gartenbauforschung (2024). DOI: 10.1093/hr/uhae041

Zur Verfügung gestellt von der Chinesischen Akademie der Wissenschaften

ph-tech