KI und die großen Sprachmodelle (LLMs), die sie mit Strom versorgen, haben eine Menge nützlicher Anwendungen, aber für all ihr Versprechen sind sie nicht sehr zuverlässig.
Niemand weiß, wann dieses Problem gelöst wird. Daher ist es sinnvoll, dass Startups eine Gelegenheit finden, Unternehmen zu helfen, sicherzustellen, dass die LLM-angetriebenen Apps, für die sie wie beabsichtigt arbeiten, für die Arbeit zahlen.
Startup mit Sitz in London Composo Das Gefühl, dass es einen Vorsprung hat, um dieses Problem zu lösen, dank seiner benutzerdefinierten Modelle, die Unternehmen helfen können, die Genauigkeit und Qualität von Apps zu bewerten, die von LLMs betrieben werden.
Das Unternehmen ähnelt wie AgentaFreeplay, Humanloop Und Langsmithdie alle behaupten, eine solide Alternative zu LLM-basierter zu menschlichen Tests, Checklisten und vorhandenen Beobachtbarkeitstools zu bieten. Aber Composo behauptet, es sei anders, weil es sowohl eine No-Code-Option als auch eine API bietet. Dies ist bemerkenswert, da dies den Umfang seines potenziellen Marktes erweitert – Sie müssen kein Entwickler sein, um ihn zu verwenden, und Domain -Experten und Führungskräfte können KI -Apps für Inkonsistenzen, Qualität und Genauigkeit selbst bewerten.
In der Praxis Composo Kombinieren Ein auf der Ausgabe geschultes Belohnungsmodell, das eine Person aus einer KI -App mit einem definierten Kriterium erkennen würde, die für diese App spezifisch sind, um ein System zu erstellen, das im Wesentlichen Ausgaben aus der App anhand dieser Kriterien bewertet. Beispielsweise kann ein Chatbot von Medical Triage seine Kunden benutzerdefinierte Richtlinien festlegen, um die Symptome der roten Flaggen zu überprüfen, und Composo kann bewerten, wie konsequent die App dies tut.
Das Unternehmen kürzlich startete eine öffentliche API Für Composo Align, ein Modell zur Bewertung von LLM -Anwendungen nach Kriterien.
Die Strategie scheint etwas zu funktionieren: Sie enthält Namen wie Accenture, Palantir und McKinsey in seiner Kundenstamm, und kürzlich hat sie 2 Millionen US-Dollar an vorsiedligen Finanzmitteln gesammelt. Die hier aufgenommene kleine Menge ist für ein Startup im heutigen Venture -Klima nicht ungewöhnlich, aber es ist schließlich bemerkenswert, weil dies KI -Land ist – die Finanzierung für solche Unternehmen ist reichlich vorhanden.
Laut dem Mitbegründer und CEO von Composo, Sebastian Fox, liegt die relativ niedrige Zahl jedoch daran, dass der Ansatz des Startups nicht besonders kapitalintensiv ist.
„Zumindest für die nächsten drei Jahre sehen wir uns nicht voraus, dass wir Hunderte von Millionen erhöhen, weil es viele Menschen aufbauen, die Fundamentmodelle bauen und dies sehr effektiv tun, und das ist nicht unser USP“, sagte Fox, ehemaliger McKinsey -Berater. „Stattdessen, jeden Morgen, wenn ich aufwache und ein Nachrichten sehe, das Openai in ihren Models einen großen Fortschritt gemacht hat, ist das gut für mein Geschäft.“
Mit dem frischen Geld plant Composo, sein Engineering-Team (angeführt von Mitbegründer und CTO Luke Markham, einem ehemaligen Ingenieur für maschinelles Lernen bei GraphCore) zu erweitern, mehr Kunden und stärken seine F & E-Bemühungen. „Der Schwerpunkt dieses Jahres liegt viel mehr auf der Skalierung der Technologie, die wir jetzt in diesen Unternehmen haben“, sagte Fox.
Britisch-KI-Vorbereitungsfonds Twin Path Ventures führte die Samenrunde an JVH Ventures Und EMOR (Letzteres hatte das Startup durch sein Beschleunigerprogramm unterstützt). „Composo befasst sich mit einem kritischen Engpass bei der Einführung von Enterprise AI“, sagte ein Sprecher von Twin Path in einer Erklärung.
Dieser Engpass ist ein großes Problem für die Gesamt -KI -Bewegung, insbesondere im Unternehmensegment, sagte Fox. „Die Menschen sind über den Hype der Aufregung und denken jetzt:« »Verändert das wirklich etwas über mein Geschäft in seiner aktuellen Form? Weil es nicht zuverlässig genug ist und es nicht konsequent genug ist. Und selbst wenn es so ist, können Sie mir nicht beweisen, wie viel es ist “, sagte er.
Dieser Engpässe könnte Composo für Unternehmen, die KI implementieren möchten, wertvoller machen, aber das Risiko eines Reputationsrisikos durchführen. Laut Fox hat sich sein Unternehmen aus diesem Grund für die agnostische Industrie entschieden, aber immer noch eine Resonanz in den Bereichen Einhaltung, Recht, Gesundheitswesen und Sicherheitsräume.
Fox ist der Ansicht, dass die F & E, die erforderlich ist, um hierher zu gelangen, nicht trivial ist. „Es gibt sowohl die Architektur des Modells als auch die Daten, mit denen wir es trainiert haben“, erklärte er, dass Composo Align auf einem „großen Datensatz von Expertenbewertungen“ geschult wurde.
Es gibt immer noch die Frage, was Tech -Giganten tun könnten, wenn sie einfach auf ihre massiven Kriegstruppen klopften, um in dieses Problem zu gelangen, aber Composo glaubt, dass es einen ersten Mover -Vorteil hat. „Der andere [thing] sind die Daten, die wir im Laufe der Zeit erhalten “, sagte Fox und bezog sich darauf, wie Composo Evaluierungspräferenzen aufgebaut hat.
Da es Apps gegen flexible Kriterien bewertet, sieht sich Composo auch als besser für den Aufstieg der Agenten -KI an als Konkurrenten, die einen eingeschränkteren Ansatz verwenden. „Meiner Meinung nach sind wir definitiv nicht in der Bühne, in der Agenten gut funktionieren, und das ist eigentlich, was wir versuchen zu lösen“, sagte Fox.