Ein Multi-Stream-Netzwerk zur Retrosynthesevorhersage

Die Retrosynthese zielt darauf ab, eine Reihe von Reaktanten für die Herstellung bestimmter Moleküle vorherzusagen, was im Bereich der Biochemie eine wichtige Rolle spielt, beispielsweise beim Design molekularer Signalwege und bei der Entdeckung von Arzneimitteln. Die meisten vorhandenen Methoden profitieren nur von einer Art von Informationen, anstatt die vielfältigen Aspekte molekularer Informationen weiter zu berücksichtigen.

Um dieses Problem anzugehen, führte ein Forschungsteam eine Studiejetzt veröffentlicht in Grenzen der Informatik.

Das Team schlug ein Multi-Stream-Netzwerk zur Retrosynthesevorhersage vor, indem es Moleküle aus mehreren Perspektiven mithilfe ihrer SMILES- und ECFPs-Deskriptoren beschreibt.

MSNR besteht aus drei Hauptmodulen: (i) Dem parallelen CNN und dem Text-CNN, das die ECFPs und SMILES nach One-Hot-Codierung als Eingabe verwendet, um die Deep Features zu erzeugen. (ii) Die Kombinationsdarstellung wird durch die Verschmelzung der beiden Arten von Tiefenmerkmalen von ECFPs und SMILES entwickelt, die eine detaillierte Perspektive der molekularen Darstellung bieten. (iii) Drei dichte Klassifikatoren wurden implementiert, um die Wahrscheinlichkeit von Reaktanten für Moleküle vorherzusagen, wobei die von verschiedenen Strömen extrahierten Tiefenmerkmale jeweils als molekulare Darstellung genutzt werden.

Durch die Fusion dieser Multi-Stream-Vorhersageergebnisse mit unterschiedlichen Gewichtungen gelangt das Modell zu einer endgültigen Retrosynthesevorhersage. Darüber hinaus wird das Modell mithilfe einer Gesamtverlustfunktion trainiert, die in der Lage ist, die vielfältigen Informationen zu nutzen, die von jedem Typ von Tiefenmerkmalen verfügbar sind.

Mehr Informationen:
Qiang Zhang et al., Ein Multi-Stream-Netzwerk zur Retrosynthesevorhersage, Grenzen der Informatik (2023). DOI: 10.1007/s11704-023-3103-z

Bereitgestellt von Frontiers Journals

ph-tech