Forscher entwickelt einen Chatbot mit Fachwissen zu Nanomaterialien

Ein Forscher hat gerade eine wissenschaftliche Arbeit fertiggestellt. Sie weiß, dass ihre Arbeit aus einer anderen Perspektive profitieren könnte. Hat sie etwas übersehen? Oder vielleicht gibt es eine Anwendung ihrer Forschung, an die sie noch nicht gedacht hatte. Ein zweites Paar Augen wäre großartig, aber selbst der freundlichste Mitarbeiter kann sich möglicherweise nicht die Zeit nehmen, alle erforderlichen Hintergrundpublikationen zu lesen, um auf dem Laufenden zu bleiben.

Kevin Yager – Leiter der Gruppe für elektronische Nanomaterialien am Center for Functional Nanomaterials (CFN), einer Benutzereinrichtung des Office of Science des US-Energieministeriums (DOE) am Brookhaven National Laboratory des DOE – hat sich vorgestellt, wie jüngste Fortschritte in der künstlichen Intelligenz (KI) und Maschinelles Lernen (ML) könnte das wissenschaftliche Brainstorming und die Ideenfindung unterstützen. Um dies zu erreichen, hat er einen Chatbot entwickelt, der über Kenntnisse in den Wissenschaften verfügt, in denen er tätig ist.

Die rasanten Fortschritte bei KI und ML sind Programmen gewichen, die kreative Texte und nützlichen Softwarecode generieren können. Diese Allzweck-Chatbots haben in letzter Zeit die öffentliche Aufmerksamkeit erregt. Bestehenden Chatbots, die auf großen, vielfältigen Sprachmodellen basieren, mangelt es an detaillierten Kenntnissen wissenschaftlicher Teildomänen.

Durch die Nutzung einer Methode zum Abrufen von Dokumenten verfügt Yagers Bot über Kenntnisse in Bereichen der Nanomaterialwissenschaft, über die andere Bots nicht verfügen. Die Einzelheiten dieses Projekts und wie andere Wissenschaftler diesen KI-Kollegen für ihre eigene Arbeit nutzen können, wurden kürzlich in veröffentlicht Digitale Entdeckung.

Aufstieg der Roboter

„CFN sucht seit langem nach neuen Möglichkeiten, KI/ML zu nutzen, um die Entdeckung von Nanomaterialien zu beschleunigen. Derzeit hilft es uns dabei, Proben schnell zu identifizieren, zu katalogisieren und auszuwählen, Experimente zu automatisieren, Geräte zu steuern und neue Materialien zu entdecken.“ Esther Tsai, ein Wissenschaftler in der Gruppe für elektronische Nanomaterialien am CFN, entwickelt einen KI-Begleiter, um Materialforschungsexperimente an der National Synchrotron Light Source II (NSLS-II) zu beschleunigen. NSLS-II ist eine weitere Benutzereinrichtung des DOE Office of Science im Brookhaven Lab.

Bei CFN wurde viel an KI/ML gearbeitet, die durch den Einsatz von Automatisierung, Steuerung, Robotik und Analyse dazu beitragen kann, Experimente voranzutreiben, aber ein Programm zu haben, das sich mit wissenschaftlichen Texten auskennt, war etwas, was die Forscher noch nicht erforscht hatten so tief. Die Fähigkeit, Informationen über ein Experiment schnell zu dokumentieren, zu verstehen und zu vermitteln, kann in vielerlei Hinsicht hilfreich sein – vom Abbau von Sprachbarrieren bis hin zur Zeitersparnis durch die Zusammenfassung größerer Arbeitsschritte.

Achten Sie auf Ihre Sprache

Um einen speziellen Chatbot zu erstellen, benötigte das Programm domänenspezifischen Text – Sprache aus Bereichen, auf die sich der Bot konzentrieren soll. In diesem Fall handelt es sich bei den Texten um wissenschaftliche Veröffentlichungen. Domänenspezifischer Text hilft dem KI-Modell, neue Terminologie und Definitionen zu verstehen und führt es in bahnbrechende wissenschaftliche Konzepte ein. Am wichtigsten ist, dass dieser kuratierte Satz von Dokumenten es dem KI-Modell ermöglicht, seine Argumentation auf vertrauenswürdige Fakten zu stützen.

Um die natürliche menschliche Sprache zu emulieren, werden KI-Modelle an vorhandenen Texten trainiert, sodass sie die Struktur der Sprache erlernen, sich verschiedene Fakten merken und eine primitive Art des Denkens entwickeln können. Anstatt das KI-Modell mühsam anhand nanowissenschaftlicher Texte neu zu trainieren, gab Yager ihm die Möglichkeit, relevante Informationen in einer kuratierten Reihe von Veröffentlichungen nachzuschlagen. Die Bereitstellung einer Bibliothek relevanter Daten war nur die halbe Miete. Um diesen Text genau und effektiv nutzen zu können, müsste der Bot eine Möglichkeit haben, den richtigen Kontext zu entschlüsseln.

„Eine Herausforderung, die bei Sprachmodellen häufig auftritt, besteht darin, dass sie manchmal plausibel klingende, aber unwahre Dinge ‚halluzinieren‘“, erklärte Yager. „Dies war ein zentrales Problem, das es für einen Chatbot zu lösen galt, der in der Forschung eingesetzt wird, im Gegensatz zu einem Chatbot, der beispielsweise Gedichte schreibt. Wir wollen nicht, dass er Fakten oder Zitate fabriziert. Das musste angegangen werden. Die Lösung dafür haben wir gefunden.“ „Einbettung“ nennen wir eine Möglichkeit, Informationen schnell hinter den Kulissen zu kategorisieren und zu verknüpfen.“

Beim Einbetten handelt es sich um einen Prozess, der Wörter und Phrasen in numerische Werte umwandelt. Der resultierende „Einbettungsvektor“ quantifiziert die Bedeutung des Textes. Wenn ein Benutzer dem Chatbot eine Frage stellt, wird diese auch an das ML-Einbettungsmodell gesendet, um ihren Vektorwert zu berechnen. Dieser Vektor wird verwendet, um eine vorberechnete Datenbank mit Textteilen aus wissenschaftlichen Arbeiten zu durchsuchen, die auf ähnliche Weise eingebettet wurden. Der Bot verwendet dann gefundene Textausschnitte, die einen semantischen Bezug zur Frage haben, um ein umfassenderes Verständnis des Kontexts zu erhalten.

Die Anfrage des Benutzers und die Textausschnitte werden zu einer „Eingabeaufforderung“ kombiniert, die an ein großes Sprachmodell gesendet wird, ein umfangreiches Programm, das Text erstellt, der der natürlichen menschlichen Sprache nachempfunden ist, und das die endgültige Antwort generiert. Durch die Einbettung wird sichergestellt, dass der entnommene Text im Kontext der Frage des Benutzers relevant ist. Durch die Bereitstellung von Textabschnitten aus dem Hauptteil vertrauenswürdiger Dokumente generiert der Chatbot Antworten, die sachlich und quellenbezogen sind.

„Das Programm muss wie ein Referenzbibliothekar sein“, sagte Yager. „Es muss sich stark auf die Dokumente verlassen, um fundierte Antworten zu liefern. Es muss in der Lage sein, genau zu interpretieren, was die Leute fragen, und in der Lage sein, den Kontext dieser Fragen effektiv zusammenzusetzen, um die relevantesten Informationen abzurufen. Während die Antworten dies möglicherweise nicht tun.“ noch perfekt ist, ist es bereits in der Lage, herausfordernde Fragen zu beantworten und einige interessante Gedanken bei der Planung neuer Projekte und Forschung anzuregen.“

Bots, die Menschen stärken

CFN entwickelt KI/ML-Systeme als Werkzeuge, die es menschlichen Forschern ermöglichen, an anspruchsvolleren und interessanteren Problemen zu arbeiten und mehr aus ihrer begrenzten Zeit herauszuholen, während Computer sich wiederholende Aufgaben im Hintergrund automatisieren. Es gibt noch viele Unbekannte über diese neue Arbeitsweise, aber diese Fragen sind der Beginn wichtiger Diskussionen, die Wissenschaftler derzeit führen, um sicherzustellen, dass der Einsatz von KI/ML sicher und ethisch ist.

„Es gibt eine Reihe von Aufgaben, die ein domänenspezifischer Chatbot wie dieser einem Wissenschaftler abnehmen könnte. Dokumente klassifizieren und organisieren, Veröffentlichungen zusammenfassen, auf relevante Informationen hinweisen und sich in ein neues Themengebiet einarbeiten, sind nur einige Möglichkeiten.“ Anwendungen“, bemerkte Yager. „Ich bin jedoch gespannt, wohin das alles führen wird. Wir hätten uns vor drei Jahren nie vorstellen können, wo wir jetzt sind, und ich freue mich darauf, wo wir in drei Jahren sein werden.“

Für Forscher, die diese Software selbst ausprobieren möchten, finden Sie hier den Quellcode für den Chatbot von CFN und die zugehörigen Tools GitHub-Repository.

Mehr Informationen:
Kevin G. Yager, Domänenspezifische Chatbots für die Wissenschaft mit Einbettungen, Digitale Entdeckung (2023). DOI: 10.1039/D3DD00112A

Bereitgestellt vom Brookhaven National Laboratory

ph-tech