Googles Gradient unterstützt Send AI, um Unternehmen dabei zu helfen, Daten aus komplexen Dokumenten zu extrahieren

Googles Gradient unterstuetzt Send AI um Unternehmen dabei zu helfen

Ein junges niederländisches Startup möchte Unternehmen dabei helfen, Daten aus großen Mengen komplexer Dokumente zu extrahieren, bei denen Genauigkeit und Sicherheit von größter Bedeutung sind – und hat sich dafür gerade die Unterstützung von Googles Gradient Ventures gesichert.

Senden Sie KIwie das Startup heißt, nimmt es mit etablierten Unternehmen im Bereich der Dokumentenverarbeitung auf, darunter UiPath, Abbyy, RossumUnd Kofaxmit einer anpassbaren Plattform, die es Unternehmen ermöglicht, KI-Modelle an ihre individuellen Datenextraktionsanforderungen anzupassen.

Beispielsweise muss ein Unternehmen, das in einer stark regulierten Branche wie der Versicherung tätig ist, wahrscheinlich unzählige Formate verarbeiten, von PDFs und Papierdateien bis hin zu Smartphone-Fotos, die in allen möglichen Ausrichtungen und Hintergrundgeräuschen aufgenommen wurden. Solche nicht standardmäßigen „unstrukturierten“ Datentypen können für Menschen schwierig genug zu analysieren sein, aber ein vollständig maschinell gesteuerter Ansatz kann zu irrtümlichen Ablehnungen von Ansprüchen oder Erstattungen und späterem Verwaltungsaufwand führen.

Tatsächlich ist typische handelsübliche Dokumentenverarbeitungssoftware häufig für gängigere Dokumenttypen konzipiert, die sich mit mehreren Branchen überschneiden, sodass sie für bestimmte Anwendungsfälle ungeeignet sind. Mit Send AI hingegen können Unternehmen ein Computer-Vision-Modell trainieren, um bestimmte Dokumente zu erkennen, und ein separates Sprachmodell, um die relevanten Daten zu extrahieren und zu validieren – wobei im Zweifelsfall Menschen hinzugezogen werden, um jedes einzelne Dokument zu kontrollieren und zu überprüfen Schritt für Schritt durch eine Weboberfläche.

„Diese Validierung kann so einfach sein wie die Überprüfung, ob eine erwartete Nummer wirklich eine Nummer ist, oder eine anspruchsvollere Suche einer Registrierungsnummer in einer Datenbank, um zu sehen, ob es eine Übereinstimmung gibt“, sagt der Gründer und CEO von Send AI Thom Trentelman sagte Tech. „Jegliche Unsicherheiten werden zur menschlichen Überprüfung gemeldet.“

Send AI wurde 2021 zunächst als Autopilot in Amsterdam gegründet und hat zuvor eine kleine Investition in Höhe von 100.000 US-Dollar aus einem Alumni-Fonds für Universitätsabsolventen eingeworben. Als das Unternehmen nun jedoch an Fahrt aufnimmt, hat das Unternehmen nun vorab weitere 2,2 Millionen Euro (2,4 Millionen US-Dollar) eingesammelt -Seed-Finanzierungsrunde unter der gemeinsamen Leitung von Googles Gradient Ventures und Keen Venture Partners, mit Beteiligung einer Reihe von Angels aus Unternehmen wie DeepMind.

Wie es funktioniert

Unternehmen können über APIs auf die cloudbasierte Software von Send AI zugreifen, die Daten aus per E-Mail gesendeten Dokumenten weiterleitet. Nach dem Empfang verbessert Send AI die Dokumente visuell, bevor es sie zur Klassifizierung und Extraktion an seine Sprachmodelle sendet.

In Bezug auf den Zielmarkt sagt Trentelman, dass das Unternehmen im Wesentlichen auf größere Unternehmen abzielt, da diese „am meisten mit Dokumenten zu kämpfen haben“, obwohl in Wirklichkeit jedes Unternehmen, das große Mengen an Dokumenten verarbeitet, einen Einsatz für die Technologie finden könnte

Bildnachweise AI senden: Datenextraktion

Es versteht sich vielleicht von selbst, dass Send AI neben der Vielzahl bestehender Dokumentenverarbeitungstools, die bereits auf dem Markt sind, auch mit einer neuen Generation von Start-ups konfrontiert ist, die Dienste verkaufen, die auf leistungsstarken neuen großen Sprachmodellen (LLMs) basieren, wie es OpenAI tut GPT-X (das ChatGPT unterstützt). Trentelman räumt zwar ein, dass solche Produkte hervorragend für Situationen funktionieren, in denen eine „subjektiv gute“ Bewertung erforderlich ist, etwa bei der Zusammenfassung oder der Beantwortung von Fragen, bei denen ein hohes Maß an Genauigkeit bei großen Dokumentenmengen erforderlich ist, doch die Sache ist eine andere.

„Mit diesen Technologien werden Sie früher oder später an Grenzen stoßen – große, generische LLMs sind immer noch unvorhersehbar, langsam und teuer“, sagte Trentelman. „Bei Send AI lassen wir den Kunden seine eigene Lösung erstellen.“

Unter der Haube basiert Send AI auf kleineren Open-Source-Modellen, die der Kunde zunächst trainiert, indem er einen kleinen Satz Dokumente manuell verarbeitet. Anschließend werden neue Dokumente mit Korrekturen von Menschen wiederholt.

Preislich berechnet Send AI auf Basis einer Gutschrift, wobei der Kunde pro Bearbeitungsschritt zahlt. „Auf diese Weise können wir zwischen der Verarbeitung eines 50-seitigen PDFs oder nur eines einzelnen Textausschnitts unterscheiden“, sagte Trentelman. „Unsere Modelle sind günstig, schnell und zuverlässig, sodass wir sie kundenindividuell einsetzen können. Auf diese Weise haben Kunden die Kontrolle über ihre Daten und Leistung, weshalb wir in regulierten Branchen wie Krankenversicherungen und Behörden gut abschneiden.“

Kontrolle

Send AI behauptet, dass seine Technologie aufgrund der Kontrolle, die sie den Kunden über ihre Daten gibt, für stark regulierte Branchen attraktiv sein wird, was angesichts der Tatsache, dass alles cloudbasiert ist, kontraintuitiv erscheinen könnte. Trentelman weist jedoch darauf hin, wie ein typisches LLM von OpenAI funktioniert: gegenüber die Art und Weise, wie Trainingsdaten von mehreren verschiedenen Kunden in einem einzigen Modell zusammengeführt werden könnten, was das Potenzial für den Verlust sensibler Daten erhöht. Genau aus diesem Grund haben wir eine Reihe von Start-ups mit dem Versprechen gesehen, private Daten in LLM-basierter Software zu schützen.

Send AI versucht, solche Bedenken auszuräumen, indem es für jeden Kunden kleine, isolierte Open-Source-Transformermodelle bereitstellt.

„Wir verwenden eine Vielzahl von ihnen, um unsere Arbeit zu erledigen – im Auslieferungszustand beeindrucken sie nicht besonders, aber sobald sie mit hochwertigen Daten trainiert werden, werden sie leistungsstark und präzise“, sagte Trentelman.

Während die Modelle und die zugehörigen Trainingsdaten also immer noch in der Cloud von Send AI gespeichert sind, bedeutet die Verwendung isolierter Modelle, dass das Unternehmen genau bestimmen kann, wo sich die Daten befinden, und sie somit auf Anfrage löschen kann. Laut Trentelman reicht dies aus, um es zu einem „bevorzugten Kandidaten“ gegenüber anderen Anbietern zu machen, und trägt dazu bei, datenschutzorientierte Unternehmen davon zu überzeugen, dass On-Premise-Implementierungen nicht ihre einzige Option sind.

„Heutzutage erlauben stärker regulierte Unternehmen Lieferanten die Nutzung der Public Cloud, sofern sie eine umfangreiche Liste von Vorschriften einhalten“, sagte Trentelman. „Im Vorfeld standen wir immer vor der Frage, ob wir eine Bereitstellung vor Ort durchführen könnten, aber schließlich haben sich alle bis auf ein Unternehmen für unser Public-Cloud-Angebot entschieden.“

Derzeit läuft Send AI im privaten Beta-Modus, obwohl es bereits einige beeindruckende Kunden hat, darunter den Versicherungsgiganten Axa. Mit einem Team von heute sieben Mitarbeitern plant das Unternehmen, die frische Liquidität zu nutzen, um seine Mitarbeiterzahl im Laufe des Jahres vor dem vollständigen kommerziellen Start zu verdoppeln.

tch-1-tech