Modelle des maschinellen Lernens bringen sich gegenseitig bei, molekulare Eigenschaften zu identifizieren

Biomedizinische Ingenieure der Duke University haben eine neue Methode entwickelt, um die Wirksamkeit von Modellen für maschinelles Lernen zu verbessern. Durch die Kombination zweier Modelle für maschinelles Lernen, eines zum Sammeln von Daten und eines zum Analysieren, können Forscher die Einschränkungen der Technologie umgehen, ohne Einbußen bei der Genauigkeit hinnehmen zu müssen.

Diese neue Technik könnte es Forschern erleichtern, mithilfe von Algorithmen für maschinelles Lernen Moleküle für den Einsatz in potenziellen neuen Therapeutika oder anderen Materialien zu identifizieren und zu charakterisieren.

Die Forschung ist veröffentlicht im Tagebuch Künstliche Intelligenz in den Biowissenschaften.

Bei herkömmlichen Modellen des maschinellen Lernens gibt ein Forscher einen Datensatz ein und das Modell verwendet diese Informationen, um Vorhersagen zu treffen. Obwohl dies oft effektiv ist, werden die Fähigkeiten dieser Tools durch die Datensätze eingeschränkt, die zum Trainieren verwendet werden. Oft fehlen wichtige Informationen oder sie enthalten zu viele Daten eines Datentyps, was zu einer Verzerrung des Modells führt.

Stattdessen haben Forscher eine Technik namens aktives maschinelles Lernen entwickelt, bei der das Modell in der Lage ist, Fragen zu stellen oder weitere Informationen anzufordern, wenn es eine Lücke in den Daten erkennt. Diese Fragefähigkeit macht das Modell genauer und effizienter als sein passives Gegenstück.

Obwohl aktives Lernen für Modelle des maschinellen Lernens sehr effektiv ist, stößt die Technik bei der Anwendung auf komplexere tiefe neuronale Netze auf erhebliche Einschränkungen. Diese Deep-Learning-Modelle sind so konzipiert, dass sie das menschliche Gehirn nachahmen. Sie erfordern weitaus mehr Daten – und Rechenleistung – als häufig verfügbar ist, was ihre Genauigkeit und Wirksamkeit einschränkt.

Reker und sein Team wollten herausfinden, ob ein pädagogisches Konzept namens „Yoked Learning“ auf die Welt des maschinellen Lernens angewendet werden kann, um diese Systeme zu verbessern.

Beim Joch-Lernen lernt ein Schüler aktiv Inhalte. Sie können Fragen stellen und in verschiedenen Lehrbüchern nach fehlenden Informationen suchen. Ein zweiter Schüler wird dann damit beauftragt, die Informationen durchzugehen, die der erste Schüler für das Verständnis der Lektion als wichtig erachtete. Während Studien zum Joch-Lernen gezeigt haben, dass der zweite Schüler oft nicht in der Lage ist, Konzepte zu lernen und Wissen nicht so effektiv zu behalten wie der aktiv lernende Schüler, glaubte Reker, dass die Technik beim maschinellen Lernen vielversprechend sei.

„Ein aktives maschinelles Lernmodell weiß, wie es einen Datensatz durchgeht und nicht nur die wichtigen Informationen identifiziert, sondern auch alle fehlenden Informationen anfordert, die es für wichtig hält“, sagte Reker. „Wir wollten sehen, ob wir dieses aktive Modell des maschinellen Lernens verwenden können, um ein anderes Modell anhand der Daten zu ‚lehren‘, die das aktiv lernende Modell für wichtig hält.“

Um zu verstehen, wie gekoppeltes maschinelles Lernen mit aktivem maschinellen Lernen verglichen wird, ließ das Team ein aktiv lernendes Modell verschiedene Eigenschaften molekularer Verbindungen identifizieren, die für den Erfolg als Therapeutikum wichtig sind, wie etwa die potenzielle Toxizität des Moleküls und den Stoffwechsel des Moleküls. Ein Jochsystem wurde entwickelt, indem verschiedene „Lehr“-Modelle für maschinelles Lernen mit unterschiedlichen „Schüler“-Modellen für maschinelles Lernen gepaart wurden, um dieselben Merkmale auf der Grundlage der vom „Lehr“-Modell ausgewählten Daten zu identifizieren.

Das Team stellte fest, dass aktives maschinelles Lernen zwar in den meisten Fällen genauer war als das Jochsystem, die Jochmodelle jedoch unter bestimmten Parametern sehr effektiv waren.

„Wir haben gesehen, dass die Leistung des Lehrmodells für die Studierendenmodelle sehr wichtig war“, erklärte Reker. „Genau wie im wirklichen Leben bedeutet ein ineffektiver Lehrer, dass der Schüler nicht auf Erfolg vorbereitet ist. Wenn das Unterrichtsmodell keine nützlichen Daten identifizierte, war das Schülermodell nicht so erfolgreich bei der Entschlüsselung dieser Daten.“

Diese Ergebnisse motivierten Reker und sein Team, Yoked Learning mit einem tiefen neuronalen Netzwerkmodell als „Student“ zu testen, das Yoked Deep Learning oder YoDeL genannt wird. Im Gegensatz zu einem aktiven Deep-Learning-Modell, bei dem das tiefe neuronale Netzwerk selbst für die Auswahl der Daten verantwortlich ist, verfügt YoDeL über einen weiteren aktiven Algorithmus für maschinelles Lernen, der als „Lehrer“ fungiert und die Datenerfassung für den „Schüler“ des tiefen neuronalen Netzwerks aktiv leitet.

In mehreren Vergleichsstudien mit verschiedenen Modellen stellte das Team fest, dass ihre YoDeL-Technik bei der Identifizierung verschiedener molekularer Merkmale entweder besser abschnitt oder genauso genau war wie ein aktives Deep-Learning-System. Sie fanden auch heraus, dass YoDeL viel schneller war und oft nur wenige Minuten für die Erledigung einer Aufgabe benötigte, während tiefes aktives Lernen Stunden oder sogar Tage dauern würde.

Das Team hat ein vorläufiges Patent für die YoDeL-Technik angemeldet, hat aber bereits Pläne, die Parameter des Modells weiter zu testen und zu verbessern sowie es in der realen Welt einzusetzen.

„Es gibt viele verschiedene Modelle für maschinelles Lernen und tiefe neuronale Netze, daher wollen wir herausfinden, welche Paare für dieses gekoppelte Lernen wirklich gut zusammenpassen“, sagte Reker. „YoDeLs Fähigkeit, die Stärken klassischer Modelle des maschinellen Lernens zu nutzen, um die Wirksamkeit tiefer neuronaler Netze zu steigern, macht es zu einem sehr spannenden Werkzeug in einem Bereich, der sich ständig weiterentwickelt. Wir sind optimistisch, dass wir und andere Wissenschaftler dieses Werkzeug in naher Zukunft nutzen können.“ um bei der Entdeckung neuer Medikamente und neuer Lösungen zur Medikamentenverabreichung zu helfen.“

Mehr Informationen:
Zhixiong Li et al., Yoked Learning in der molekularen Datenwissenschaft, Künstliche Intelligenz in den Biowissenschaften (2023). DOI: 10.1016/j.ailsci.2023.100089

Bereitgestellt von der Duke University

ph-tech