Deutsches Startup Kern AI sichert sich Anschubfinanzierung für modulare NLP-Entwicklungsplattform • Tech

Deutsches Startup Kern AI sichert sich Anschubfinanzierung fuer modulare NLP Entwicklungsplattform

Die Verarbeitung natürlicher Sprache (NLP) ist zwar kaum eine neue Disziplin, hat sich aber in den letzten Monaten ins öffentliche Bewusstsein katapultiert, was zum großen Teil dem Hype-Train für generative KI namens ChatGPT zu verdanken ist. Neben anderen NLP-Modellen wie Hugging Face’s Transformers und Googles LaMDA, das seinen ChatGPT-Rivalen Bard antreiben soll, gibt es ein greifbares Gefühl, dass die Ankunft von KI im Mainstream fast bevorsteht.

Aber für diejenigen, die ein paar Schlüsselwörter in ChatGPT eingeben, um sie zu erstellen es entstehen Texte im Stil von Nick Caveist es leicht, all die Arbeit zu übersehen, die in die Entwicklung der zugrunde liegenden KI-Modelle gesteckt wird, um sie an den Punkt zu bringen, an dem sie für den Massenmarktverbrauch bereit sind.

Um NLP-Modelle zu erstellen, benötigen Entwickler nicht nur Algorithmen, sondern jede Menge hochwertige Trainingsdaten, die genau „etikettiert“ sind, eine Technik, die Rohdaten kategorisiert, damit Maschinen sie verstehen und daraus lernen können. Es gibt zahlreiche Unternehmen, die diesen Kennzeichnungsprozess vorantreiben, darunter ein deutsches Startup Kern-KIdas eine Plattform für NLP-Entwickler und Datenwissenschaftler aufgebaut hat, um nicht nur den Kennzeichnungsprozess zu steuern, sondern auch Nebenaufgaben zu automatisieren und zu orchestrieren und es ihnen zu ermöglichen, sich mit Daten von geringer Qualität zu befassen, die ihnen in den Weg kommen.

„Datenzentriertes“ NLP

Da NLP derzeit einer der heißesten KI-Trends ist, gab Kern AI heute bekannt, dass es 2,7 Millionen Euro (2,9 Millionen US-Dollar) an Seed-Finanzierung aufgebracht hat, um das jüngste Wachstum zu verdoppeln, das von kommerziellen Kunden, einschließlich Versicherungsunternehmen, angenommen wurde Barmenia Und VHV VersicherungenLogistikunternehmen wie die Tochtergesellschaft der Metro Supply Chain Group Evolutionszeit kritisch, und Venture-Backed-Startups wie Crowd.dev. Das Unternehmen sagt auch, dass seine grundlegende Open-Source-Inkarnation von Datenwissenschaftlern in Unternehmen wie Samsung und DocuSign verwendet wurde.

Mitbegründer und CEO Johannes Hötter, der 2020 in Bonn gegründet wurde, sagte, er habe das Unternehmen „mit der Überzeugung gegründet, dass sich NLP zu einer zentralen Digitalisierungstechnologie entwickeln wird“, und räumte ein, dass Entwickler mehr Kontrolle und Flexibilität über den NLP-Entwicklungsprozess benötigen.

Das Flaggschiffprodukt des Unternehmens ist Open Source Raffineriedas es Entwicklern ermöglicht, einen datenzentrierten Ansatz zum Erstellen von NLP-Modellen durch Halbautomatisierung ihrer Kennzeichnung zu verfolgen, Datensätze von geringer Qualität in ihren Trainingsdaten zu identifizieren und alle ihre Daten in einer einzigen Oberfläche zu überwachen.

Anderswo, Ziegel – ebenfalls Open Source – ist eine Sammlung modularer, standardisierter „Code-Snippets“, die Entwickler in Refinery integrieren können – es ist die „Anwendungslogik, die Ihre NLP-Automatisierungen vorantreibt“, so das Unternehmen.

Kern AI: Beispiel einer Raffinerie in Aktion Bildnachweis: Kern AI

Hötter sagte, dass ein typischer realer Anwendungsfall für die KI-Plattform von Kern die internen Tools von Unternehmen betrifft. Beispielsweise muss ein Logistikunternehmen möglicherweise auf eine Kundenanfrage wie „Bitte schicken Sie bis morgen 16:00 Uhr 20 Paletten an unser Werk in Göteborg“ – solche zeitkritischen Anfragen müssen schnell beantwortet werden. Das Logistikunternehmen könnte Kern AI verwenden, um eingehende Anfragen mit seinem Transportmanagementsystem (TMS) zu synchronisieren, um die Absicht und die Anforderungen der Anfrage automatisch zu erkennen.

„Dazu wird der Service-Posteingang mit unserem kommerziellen Produkt-Workflow synchronisiert, der die Daten dann an Refinery weiterleitet“, erklärte Hötter gegenüber Tech. „Hier können Entwickler NLP-Techniken verwenden, um die Anfrage zu analysieren, und dann die strukturierten extrahierten Informationen direkt an ihr TMS weiterleiten.“

In gewisser Weise funktioniert dies also ähnlich wie Zapier, aber anstatt einem regelbasierten Ansatz zu folgen, ist es für ein komplexeres Verständnis natürlicher Sprache konzipiert.

Der Stand der Dinge

Tatsächlich gibt es bereits unzählige ähnliche Plattformen, die die gesamte proprietäre und Open-Source-Landschaft abdecken. Dazu gehört Argilla, das kürzlich a Seedrunde im Wert von 1,6 Millionen US-Dollar der Finanzierung und Heartex, das im vergangenen Jahr eine kräftigere Finanzierungstranche in Höhe von 25 Millionen US-Dollar abschloss Etikettenstudio. Und dann ist da noch Snorkel AI, ein proprietäres Angebot, das im Laufe seiner Geschichte rund 135 Millionen US-Dollar an Finanzierung gesichert hat.

Was genau macht Kern AI anders? Hötter sagt, dass es der einzige derzeit auf dem Markt erhältliche „Open-Core und modulare Full Stack“ ist. Damit meint er, dass seine Plattform entweder als entwicklerorientiertes Add-On verwendet werden kann, das in bestehende Etikettierungsplattformen wie Labelstudio eingesteckt wird, oder dass sie verwendet werden kann, um ganze datenzentrische NLP-Anwendungen in ihrer Gesamtheit zu erstellen.

„Das bedeutet, dass Sie Refinery entweder als Anwendung verwenden können, um Ihre Trainingsdaten lediglich zu verwalten und zu erstellen, zum Beispiel wenn Sie ein Startup sind, das ein ausgeklügeltes NLP-Produkt erstellen möchte und jetzt eine großartige Lösung zum Erstellen der Daten benötigt“, sagte Hötter . „Alternativ können Sie auch die Algorithmen von Refinery verwenden, um eine Echtzeit-API bereitzustellen und vollständige Workflows zu orchestrieren, die die gesamte Wertschöpfungskette abdecken würden. Unser Ziel ist es, die Fortschritte des modernen NLP unabhängig von ihrem aktuellen Tech-Stack in Datenteams zu bringen, und daher ist unsere Plattform modular aufgebaut.“

Kern AI zählt derzeit rund neun Mitarbeiter, die größtenteils remote arbeiten, aber ein physisches Büro in ihrer Heimatstadt Bonn unterhalten.

Zuvor hatte Kern AI eine kleine Pre-Seed-Finanzierungsrunde in Höhe von 550.000 € (587.000 US-Dollar) aufgebracht, und mit frischen 2,9 Millionen US-Dollar auf der Bank, Hötter sagte, das Unternehmen plane, den Funktionsumfang der Plattform zu erweitern, um zusätzliche Workflows einschließlich audio- und dokumentenbasierter Daten abzudecken, und Produkte für eine viel breitere Palette von Anwendungsfällen in der Industrie zu entwickeln. Hötter sagte auch, dass sie Pläne beschleunigen werden, eine kostenlose, persönliche Stufe allgemein verfügbar zu machen, da es derzeit nur verfügbar ist auf Einladungsbasis.

Die Seed-Runde von Kern AI wurde gemeinsam von Seedcamp und Faber geleitet, mit Beteiligung von Xdeck, Another.vc und einer Handvoll Angel-Investoren.

tch-1-tech