Ein Goldrausch von NLP-Startups steht bevor – hier ist der Grund – Tech

Soul Hackers 2 Erscheinungsdatum Ankuendigungstrailer enthuellt

Denken Sie daran Verarbeitung natürlicher Sprache? NLP ist vor einigen Jahren entstanden, aber erst 2018 haben KI-Forscher bewiesen, dass es möglich ist, ein neuronales Netz einmal mit einer großen Datenmenge zu trainieren und es immer wieder für verschiedene Aufgaben zu verwenden. Im Jahr 2019 erschienen GPT-2 von Open AI und T5 von Google und zeigten, dass sie erstaunlich gut waren (es wurde jetzt in Google Duplex integriert, abgebildet). Es wurden sogar Bedenken hinsichtlich ihres möglichen Missbrauchs geäußert.

Aber seitdem sind die Dinge ziemlich exponentiell gelaufen.

2021 erlebte eine wahre „kambrische Explosion“ von NLP-Startups und großen Sprachmodellen.

Dieses Jahr veröffentlichte Google LambDa, ein großes Sprachmodell für Chatbot-Anwendungen. Dann veröffentlichte Deepmind Alpha Code und später Flamingo – ein Sprachmodell, das zum visuellen Verständnis fähig ist. Allein im Juli dieses Jahres, die Großes Wissenschaftsprojekt veröffentlichte Bloom, ein massives Open-Source-Sprachmodell, und Meta gab bekannt, dass sie ein einziges Sprachmodell trainiert haben, das in der Lage ist, zwischen 200 Sprachen zu übersetzen.

Wir erreichen jetzt eine Art Wendepunkt, an dem viele weitere kommerzielle NLP-Anwendungen auf den Markt kommen werden – einige davon verwenden einige dieser öffentlich zugänglichen Open-Source-Plattformen. Fast könnte man sagen, dass ein Goldrausch von Start-ups begonnen hat, die versuchen, auf dieser Technologie aufzubauen, und es entwickelt sich ein Wettrüsten zwischen den großen Anbietern von Sprachmodellen.

Eines dieser Startups ist Humanloop, ein KI-Spinout des University College, das behauptet, es für Unternehmen „deutlich“ einfacher zu machen, diese neue Welle der NLP-Technologie über eine Reihe von Tools zu übernehmen, mit denen Menschen KI-Algorithmen „lehren“ können. Dies bedeutet, dass ein Anwalt, Arzt oder Banker ein Stück Wissen in die Plattform einbringen kann, das die Software dann in großem Maßstab auf einen großen Datensatz anwendet, was eine breitere Anwendung von KI in verschiedenen Branchen ermöglicht.

Es hat jetzt eine Seed-Finanzierungsrunde in Höhe von 2,6 Millionen US-Dollar unter der Leitung von Index Ventures mit Beteiligung von Y Combinator, Local Globe und Albion abgeschlossen.

Gegründet im Jahr 2020 von einem Team herausragender Informatiker der UCL und Cambridge sowie Absolventen von Google und Amazon, könnten die Anwendungen von Humanloop laut dem Bericht die Erstellung eines Bildes eines nationalen Immobilienmarktes aus unstrukturierten Daten im Internet umfassen; Lesen elektronischer Patientenakten, um Personen zu identifizieren, die Kandidaten für die Erprobung neuer Therapien sein könnten; und sogar Kommentare in Facebook-Gruppen moderieren.

„Die Leute wären schockiert, wenn sie wüssten, wozu sprachbasierte KI jetzt fähig ist“, sagt CEO Raza Habib in einer Erklärung. „Aber die Daten in eine Form zu bringen, die der Algorithmus verwenden kann, ist die größte Herausforderung. Mit Humanloop wollen wir den Zugang zu KI demokratisieren und die nächste Generation intelligenter Self-Service-Anwendungen ermöglichen – indem wir es jedem Unternehmen ermöglichen, sein Fachwissen zu nutzen und es effizient in einem maschinellen Lernmodell zu destillieren.“

Humanloop behauptet, sein Erfolg sei das Wachstum des „probabilistischen Deep Learning“, bei dem Algorithmen herausfinden können, was sie nicht wissen, indem sie das Rauschen in Datensätzen ausblenden, die guten Sachen finden und Menschen um Hilfe bei den Teilen bitten, die sie nicht wissen. ich verstehe nicht.

Andere Start-ups, die ihre eigenen großen Sprachmodelle aufbauen und sie hinter APIs stellen, sind unter anderem Zusammenhängen AI (Finanzierung in Höhe von 164,9 Mio. USD) und Open AI GPT-3. Schnorchel AI (Finanzierung in Höhe von 135,3 Mio. USD) ist ebenfalls ein neues Startup in diesem Bereich.

Humanloop sagt jedoch, dass es sich weniger auf die Entwicklung der Modelle als vielmehr auf die Werkzeuge konzentriert, die benötigt werden, um sie an bestimmte Anwendungsfälle anzupassen.

„Was viele Menschen nicht wissen, ist, dass es nicht der Mangel an geeigneten Algorithmen ist, der die KI daran hindert, an jedem Arbeitsplatz allgegenwärtig zu sein – es ist das Fehlen richtig gekennzeichneter Daten“, fügt Erin Price-Wright, die Partnerin bei Index Ventures, die die Leitung hatte, hinzu die Investition. „Tatsächlich wird maschinelles Lernen selbst zunehmend kommerzialisiert und von der Stange angeboten, aber es ist immer noch sehr schwierig für Laien, ihr Wissen an eine Maschine zu übertragen und dem Algorithmus zu helfen, sein Modell zu verfeinern.“ Daher erlaubt Humanloop es Menschen, die Daten zu optimieren.

Wenn der NLP-Goldrausch tatsächlich auf dem Weg ist, erwarten Sie bald eine ganze Reihe anderer Startups …

tch-1-tech