Betaworks greift den KI-Trend nicht mit einem weiteren LLM auf, sondern mit einer Reihe von Agentenmodellen, die alltägliche Aufgaben automatisieren, die jedoch nicht so einfach zu definieren sind. Der neueste „Camp“-Inkubator des Investors hat neun KI-Agent-Startups ausgebildet und finanziert, von denen sie hoffen, dass sie die mühsameren Aufgaben von heute übernehmen.
Die Anwendungsfälle für viele dieser Unternehmen klingen vielversprechend, doch KI hat tendenziell Probleme, ihre Versprechen zu halten. Würden Sie einer glänzenden neuen KI vertrauen, die Ihre E-Mails für Sie sortiert? Wie wäre es mit dem Extrahieren und Strukturieren von Informationen aus einer Webseite? Macht es irgendjemandem etwas aus, wenn die KI Meetings dort einplant, wo es funktioniert?
Es gibt ein Element des Vertrauens, das bei diesen Diensten noch aufgebaut werden muss, was bei den meisten Technologien der Fall ist, die unser Handeln verändern. Es fühlte sich seltsam an, MapQuest nach dem Weg zu fragen, bis dies nicht mehr der Fall war – und mittlerweile ist die GPS-Navigation ein alltägliches Werkzeug. Aber handelt es sich in diesem Stadium um KI-Agenten? John Borthwick, CEO und Gründer von Betaworks, ist dieser Meinung. (Offenlegung: Der ehemalige Tech-Redakteur und Disrupt-Moderator Jordan Crook hat TC verlassen, um bei der Firma zu arbeiten.)
„Sie greifen auf etwas ein, über das wir lange nachgedacht haben“, sagte er gegenüber Tech. „Während die Agenten-KI noch in den Kinderschuhen steckt – und es Probleme mit den Erfolgsraten von Agenten usw. gibt – sehen wir bereits seit Beginn des Camps enorme Fortschritte.“
Während sich die Technologie weiter verbessern wird, erklärte Borthwick, dass einige Kunden bereit seien, sie in ihrem aktuellen Zustand zu nutzen.
„In der Vergangenheit haben wir gesehen, dass Kunden selbst bei anspruchsvolleren Aufgaben einen Vertrauensvorschuss wagten, wenn ein Produkt „gut genug“ war. Obwohl das ursprüngliche Bill.com mit OCR und E-Mail-Scraping interessante Dinge tat, machte es nicht immer alles richtig, und die Benutzer vertrauten ihm immer noch Transaktionen im Wert von Tausenden von Dollar an, weil es eine schreckliche Aufgabe weniger schrecklich machte. Und im Laufe der Zeit haben die Feedbackschleifen dieser Kunden durch ein äußerst kommunikatives Interface-Design ein noch besseres und zuverlässigeres Produkt geschaffen“, sagte er.
„Im Moment sind die meisten frühen Benutzer der Produkte in Camp Entwickler und Gründer sowie frühe Technologieanwender, und diese Gruppe war immer bereit, diese Produkte geduldig zu testen und Feedback zu geben, die schließlich zum Mainstream übergehen.“
Das Betaworks Camp ist ein dreimonatiger Accelerator, bei dem ausgewählte Unternehmen im gewählten Thema praktische Hilfe bei ihren Produkten, ihrer Strategie und ihren Verbindungen erhalten, bevor sie mit einem Scheck über 500.000 US-Dollar aus der Tür gescheucht werden – mit freundlicher Genehmigung von Betaworks selbst, Mozilla Ventures und Differential Ventures und Stem AI. Aber nicht bevor die Startups am Demo-Tag, dem 7. Mai, ihr Können unter Beweis stellen.
Vorab haben wir uns aber die Aufstellung angeschaut. Hier sind die drei, die mir am meisten aufgefallen sind.
Twin automatisiert Aufgaben mithilfe eines „Aktionsmodells“, von dem Rabbit schon seit einigen Monaten spricht (das aber noch nicht ausgeliefert wurde). Durch das Trainieren eines Modells mit vielen Daten, die Softwareschnittstellen darstellen, kann es (so behaupten diese Unternehmen) lernen, wie man allgemeine Aufgaben erledigt, Dinge, die komplexer sind, als eine API bewältigen kann, aber nicht so sehr, dass sie nicht an eine delegiert werden könnten „kluger Praktikant.“ Wir haben sie tatsächlich bereits im Januar geschrieben.
Anstatt also einen Backend-Ingenieur ein benutzerdefiniertes Skript erstellen zu lassen, um eine bestimmte Aufgabe auszuführen, können Sie diese in normaler Sprache demonstrieren oder beschreiben. Dinge wie „Legen Sie alle Lebensläufe, die wir heute erhalten haben, in einen Ordner in Dropbox und benennen Sie sie nach dem Bewerber um. Senden Sie mir dann per DM den Link zum Teilen in Slack.“ Und sobald Sie diesen Arbeitsablauf optimiert haben („Ups, dieses Mal fügen Sie das Bewerbungsdatum zu den Dateinamen hinzu“), kann dies einfach die neue Art und Weise sein, wie dieser Prozess funktioniert. Das Ziel des Unternehmens ist es, 20 % der Aufgaben zu automatisieren, die 80 % unserer Zeit in Anspruch nehmen. Die eigentliche Frage ist wahrscheinlich, ob dies kostengünstig möglich ist. (Twin lehnte es ab, näher auf die Art ihres Modells und Trainingsprozesses einzugehen.)
Skej zielt darauf ab, den manchmal mühsamen Prozess zu erleichtern, einen passenden Termin für zwei (oder drei, oder vier…) Personen zu finden. Sie setzen den Bot einfach in einer E-Mail oder einem Slack-Thread auf CC und er beginnt mit dem Abgleich der Verfügbarkeit und Präferenzen aller Personen. Wenn es Zugriff auf Zeitpläne hat, werden diese überprüft. Wenn jemand sagt, dass er am Donnerstag den Nachmittag vorziehen würde, dann funktioniert das; man kann sagen, dass einige Leute Vorrang haben; und so weiter. Jeder, der mit einem erfahrenen Assistenten der Geschäftsleitung zusammenarbeitet, weiß, dass er unersetzlich ist, aber die Chancen stehen gut, dass jeder EA da draußen lieber weniger Zeit mit Aufgaben verbringen möchte, bei denen es sich nur um eine Ansammlung von „Wie wäre es damit?“ handelt. NEIN? Wie wäre es damit?“
Als Misanthrop habe ich dieses Planungsproblem nicht, aber ich schätze es, dass andere es haben, und würde auch eine Lösung vom Typ „einstellen und vergessen“ vorziehen, bei der sie sich einfach mit den Ergebnissen abfinden. Und es liegt durchaus im Rahmen der Fähigkeiten heutiger KI-Agenten, deren Aufgabe in erster Linie darin besteht, natürliche Sprache und nicht Formen zu verstehen.
Jsonify ist eine Weiterentwicklung von Website-Scrapern, die Daten aus relativ unstrukturierten Kontexten extrahieren können. Das wird schon seit Ewigkeiten gemacht, aber die Engine, die die Informationen extrahiert, war noch nie so intelligent. Wenn es sich um ein großes, flaches Dokument handelt, funktionieren sie gut – wenn es sich um Registerkarten auf der Website oder eine schlecht codierte visuelle Liste handelt, die für Menschen zum Klicken gedacht ist, können sie scheitern. Jsonify nutzt das verbesserte Verständnis heutiger visueller KI-Modelle, um Daten besser zu analysieren und zu sortieren, auf die einfache Crawler möglicherweise nicht zugreifen können.
Sie könnten also in einem bestimmten Gebiet nach Airbnb-Optionen suchen und diese dann von Jsonify in einer strukturierten Liste mit Spalten für Preis, Entfernung zum Flughafen, Bewertung, versteckte Gebühren usw. ablegen lassen. Dann könnten Sie das Gleiche bei Vacasa tun und die gleichen Daten extrahieren – vielleicht für die gleichen Orte (ich habe das gemacht und neulich etwa 150 $ gespart, aber ich wünschte, ich hätte den Prozess automatisieren können). Oder, wissen Sie, professionelle Dinge tun.
Aber macht die Ungenauigkeit, die LLMs innewohnt, sie nicht zu einem fragwürdigen Werkzeug für den Job? „Es ist uns gelungen, ein ziemlich robustes Leitplanken- und Gegenkontrollsystem aufzubauen“, sagte Gründer Ananth Manivannan. „Wir verwenden zur Laufzeit einige verschiedene Modelle, um die Seite zu verstehen, die eine gewisse Validierung ermöglichen – und die von uns verwendeten LLMs sind genau auf unseren Anwendungsfall abgestimmt, sodass sie normalerweise auch ohne die Leitplankenschicht ziemlich zuverlässig sind. Typischerweise erreichen wir je nach Anwendungsfall eine Extraktionsgenauigkeit von über 95 %.“
Ich könnte mir vorstellen, dass irgendetwas davon in wahrscheinlich jedem technologieorientierten Unternehmen nützlich sein könnte. Die anderen in der Kohorte sind etwas technischer oder situativer – hier sind die restlichen 6:
- Aufgelöste KI – Agentische Automatisierung von Cloud-Workflows. Fühlt sich nützlich an, bis maßgeschneiderte Integrationen es einholen.
- Floode – ein KI-Posteingangswrangler, der Ihre E-Mails liest, die wichtigen Dinge findet und gleichzeitig entsprechende Antworten und Aktionen vorbereitet.
- Erweiterbare KI – Ist Ihre KI rückläufig? Fragen Sie Ihren Arzt, ob Extensible die richtige Test- und Protokollierungsinfrastruktur für Ihre Bereitstellung ist.
- Gegner – eine virtuelle Figur, mit der Kinder ausgiebig interagieren und spielen können. Fühlt sich ethisch und rechtlich wie ein Minenfeld an, aber jemand muss hindurchgehen.
- Hochdimensionale Forschung – das Infrarotspiel. Ein Framework für webbasierte KI-Agenten mit einem Pay-as-you-go-Modell, sodass Sie nur ein paar Dollar schulden, wenn das Experiment Ihres Unternehmens scheitert.
- Mbodi – generative KI für die Robotik, ein Bereich, in dem Trainingsdaten vergleichsweise knapp sind. Ich dachte, es sei ein afrikanisches Wort, aber es heißt einfach „verkörpern“.
Es besteht kaum ein Zweifel daran, dass KI-Agenten in den zunehmend automatisierten Software-Workflows der nahen Zukunft eine Rolle spielen werden, aber die Art und das Ausmaß dieser Rolle sind noch nicht beschrieben. Offensichtlich ist Betaworks bestrebt, frühzeitig Fuß zu fassen, auch wenn einige der Produkte noch nicht ganz bereit für ihr Debüt auf dem Massenmarkt sind.
Am 7. Mai können Sie die Ausstellung ihrer Agentenwaren sehen.