Anstatt als ersten Ansatz ein LLM zu verfeinern, versuchen Sie es stattdessen mit einer zeitnahen Architektur

Inmitten des Generativen Angesichts des KI-Ausbruchs verstärken Innovationsdirektoren die IT-Abteilung ihres Unternehmens auf der Suche nach maßgeschneiderten Chatbots oder LLMs. Sie wollen ChatGPT, aber mit domänenspezifischen Informationen, die umfangreiche Funktionalität, Datensicherheit und Compliance sowie verbesserte Genauigkeit und Relevanz untermauern.

Oft stellt sich die Frage: Sollten sie ein LLM von Grund auf aufbauen oder ein bestehendes mit ihren eigenen Daten verfeinern? Für die Mehrheit der Unternehmen sind beide Optionen unpraktisch. Hier ist der Grund.

TL;DR: Mit der richtigen Reihenfolge der Aufforderungen sind LLMs bemerkenswert geschickt darin, sich Ihrem Willen zu beugen. Das LLM selbst oder seine Trainingsdaten müssen nicht geändert werden, um es an bestimmte Daten oder Domäneninformationen anzupassen.

Bevor kostspieligere Alternativen in Betracht gezogen werden, ist es ratsam, erschöpfende Anstrengungen beim Aufbau einer umfassenden „Prompt-Architektur“ zu unternehmen. Dieser Ansatz soll den aus einer Vielzahl von Eingabeaufforderungen gewonnenen Wert maximieren und API-gestützte Tools verbessern.

TL;DR: Mit der richtigen Reihenfolge der Aufforderungen sind LLMs bemerkenswert geschickt darin, sich Ihrem Willen zu beugen.

Sollte sich dies als unzureichend erweisen (in einer Minderheit der Fälle), Dann Ein Feinabstimmungsprozess (der aufgrund der damit verbundenen Datenvorbereitung oft kostspieliger ist) könnte in Betracht gezogen werden. Eines von Grund auf neu zu bauen, kommt fast immer nicht in Frage.

Das angestrebte Ergebnis besteht darin, eine Möglichkeit zu finden, Ihre vorhandenen Dokumente zu nutzen, um maßgeschneiderte Lösungen zu erstellen, die die Ausführung häufiger Aufgaben oder die Beantwortung häufiger Fragen präzise, ​​schnell und sicher automatisieren. Prompt-Architektur erweist sich als der effizienteste und kostengünstigste Weg, dies zu erreichen.

Was ist der Unterschied zwischen prompter Architektur und Feinabstimmung?

Wenn Sie über eine schnelle Architektur nachdenken, haben Sie sich wahrscheinlich bereits mit dem Konzept der Feinabstimmung befasst. Hier ist der Hauptunterschied zwischen den beiden:

Während bei der Feinabstimmung das zugrunde liegende grundlegende LLM geändert werden muss, ist dies bei der schnellen Architektur nicht der Fall.

Die Feinabstimmung ist ein umfangreiches Unterfangen, das die Neuschulung eines Segments eines LLM mit einem großen neuen Datensatz – idealerweise Ihrem proprietären Datensatz – erfordert. Dieser Prozess verleiht dem LLM domänenspezifisches Wissen und versucht, es an Ihre Branche und Ihren Geschäftskontext anzupassen.

Im Gegensatz dazu beinhaltet Prompt Architecting die Nutzung vorhandener LLMs, ohne das Modell selbst oder seine Trainingsdaten zu ändern. Stattdessen kombiniert es eine komplexe und clever konstruierte Reihe von Eingabeaufforderungen, um eine konsistente Ausgabe zu liefern.

Für Unternehmen mit höchsten Datenschutzanforderungen (z. B. Banken) ist eine Feinabstimmung sinnvoll.

tch-1-tech