Open-Source-Programm identifiziert synthetische, natürlich vorkommende Gensequenzen

Soul Hackers 2 Erscheinungsdatum Ankuendigungstrailer enthuellt

Es ist eine Selbstverständlichkeit, dass bestimmte Bakterien und Viren Krankheiten und Krankheiten verursachen können, aber die wahren Schuldigen sind die besorgniserregenden Sequenzen, die in den Genomen dieser Mikroben liegen.

Es wird einfacher, sie anzurufen.

Jahrelange Arbeit von Informatikern der Rice University und ihren Kollegen hat zu einer verbesserten Plattform für das DNA-Screening und die Charakterisierung pathogener Sequenzen geführt, ob natürlich vorkommend oder synthetisch, bevor sie die Möglichkeit haben, die öffentliche Gesundheit zu beeinflussen.

Der Informatiker Todd Treangen von der George R. Brown School of Engineering von Rice und die Genomspezialistin Krista Ternus von Signature Science LLC leiteten die Studie, aus der SeqScreen hervorging, ein Programm zur genauen Charakterisierung kurzer DNA-Sequenzen, die oft als Oligonukleotide bezeichnet werden.

Laut Treangen soll SeqScreen die Erkennung und Verfolgung einer breiten Palette pathogener Sequenzen verbessern.

„SeqScreen ist das erste Open-Source-Software-Toolkit, das für das Screening synthetischer DNA verfügbar ist“, sagte Treangen. „Unser Programm verbessert den bisherigen Stand der Technik für Unternehmen, Einzelpersonen und Regierungsbehörden für ihre DNA-Screening-Praktiken.“

Die Studie, die als risikoreiches, hochlohnendes Forschungsprojekt begann, erscheint in der Zeitschrift Genombiologie.

SeqScreen nutzt die Arbeit von Partnern des in Austin, Texas, ansässigen Unternehmens Signature Science, um eine Datenbank mit Tausenden von Gensequenzen zu pflegen, die 32 Arten von Virulenzfunktionen darstellen. „Die Entwicklung dieser kuratierten Datenbank erforderte Jahre der Biokuration und Überprüfung und bildet den Kern der Trainingsdaten des maschinellen Lernalgorithmus von SeqScreen“, sagte Treangen.

Das Unternehmen hat letztes Jahr mit Treangen zusammengearbeitet, um SARS-CoV-2-Mutationen zu finden, die die Omicron-Variante möglicherweise resistenter gegen Antikörper gemacht haben, einschließlich solcher aus Impfungen. „SeqScreen kam zuerst und einige seiner Ideen wurden auf das COVID-Projekt übertragen“, sagte er. „Aber SeqScreen hat einen viel breiteren Anwendungsbereich.“

„Wir konzentrieren uns auf die Identifizierung von Funktionen von relevanten Sequenzen – die wir FunSoCs nennen – während frühere Screening-Ansätze sich mehr mit der Frage beschäftigten, ‚Bist du dieses Bakterium?‘ oder ‚Bist du dieser Virus?‘“, sagte Treangen. „SeqScreen konzentriert sich nicht auf die Namen der Bakterien oder Viren in Ihrer Probe. Wir möchten vielmehr wissen, ob es in dieser Probe Sequenzen gibt, die schädlich sein könnten, wie z. B. Toxine, die menschliche Zellen zerstören können.“

Es sei wichtig, sich auf besorgniserregende Funktionen zu konzentrieren, sagte er, da Bakterien DNA leicht über horizontalen Gentransfer austauschen.

„Wir haben Beispiele in der Veröffentlichung von Bakterien hervorgehoben, deren Genome im Wesentlichen identisch sind, außer dass eines eine besorgniserregende Sequenz wie ein Toxin aufweist, das das andere nicht hat“, sagte Treangen. „SeqScreen konzentriert sich wirklich auf das Vorhandensein oder Fehlen von Funktionen, die Virulenzfaktoren darstellen.“

Er sagte, SeqScreen werde auch beim Nachweis neuer oder neu auftretender Krankheitserreger aus der Umwelt helfen.

Mehr Informationen:
Advait Balaji et al, SeqScreen: Genaues und empfindliches funktionelles Screening pathogener Sequenzen durch Ensemble-Lernen, Genombiologie (2022). DOI: 10.1186/s13059-022-02695-x

Bereitgestellt von der Rice University

ph-tech