Computer Vision ist in unzähligen Branchen alltäglich geworden, aber die Methoden zur Erstellung und Steuerung dieser visuellen KI-Modelle sind nicht so einfach. Viso baut eine Low-/No-Code-End-to-End-Plattform, die es Unternehmen ermöglicht, ihren eigenen Computer-Vision-Stack zu entwickeln, und hat gerade 9 Millionen US-Dollar für die Skalierung eingesammelt.
Natürlich gibt es unzählige Computer-Vision-Modelle und -Dienste, aber viele passen irgendwie zur Beschreibung von „Modell als API“. Angenommen, Sie möchten Personen erkennen und bewerten, ob sie stehen oder sitzen, damit Sie erkennen können, wie beschäftigt ein Bahnhof oder ein Restaurant ist.
Für die Personen- und Posenerkennung stehen Ihnen vollständig ausgereifte Optionen zur Verfügung, diese passen jedoch möglicherweise nicht zu Ihrem Anwendungsfall oder Sicherheitsmodell oder sind zu teuer für die Skalierung. Der Aufbau eines eigenen CV-Modells ist eine Option, aber das Fachwissen, das zum Trainieren und Einsatz moderner Lebenslaufmodelle erforderlich ist, ist nicht trivial: Wenn Sie nicht die Zeit und das Geld haben, ein echtes Team aufzubauen, ist dies möglicherweise unerreichbar.
Das ist die Art von Situation, die Viso beheben möchte, indem es eine Plattform bereitstellt, auf der Sie ein eigenes Lebenslaufmodell auf Unternehmensniveau erstellen können, ohne den Zeit- und Ressourcenaufwand, der oft dafür erforderlich ist.
„Zu Beginn des Einführungszyklus greifen Unternehmen auf den Kauf/Miete vorgefertigter Computer-Vision-Systeme zurück. Letztendlich müssen sie jedoch alle Computer-Vision-Initiativen zusammenführen (Rationalisierung), sie tiefgreifend integrieren und anpassen und sie auch „besitzen“, weil die Daten sensibel und die Technologie von strategischem Wert ist. Aus diesem Grund beginnen Unternehmen in diesen Branchen, KI-Ingenieure einzustellen“, erklärte Gaudenz Boesch, Mitbegründer und Co-CEO von Viso.
Aber im Gegensatz zu vielen anderen Anforderungen auf Unternehmensebene fehlt der Computer Vision eine „spezialisierte Infrastruktur“, um sie effizient aufzubauen und bereitzustellen.
„Unternehmen müssen es von Grund auf neu aufbauen und versuchen, eine Vielzahl getrennter Software- und Hardwareplattformen (Kameras, Server) im gesamten Unternehmen zusammenzustellen“, fuhr er fort. Dies wiederum erfordert Fachwissen in zahlreichen Bereichen, das schnell zu teuer wird.
Der Ansatz von Viso wird wahrscheinlich jedem bekannt vorkommen, der No-Code-Tools in anderen Kontexten verwendet hat. Dabei handelt es sich um eine Reihe vorgefertigter und anpassbarer Module, mit denen ein Benutzer nach Bedarf Computer-Vision-Modelle auswählen, trainieren und einsetzen kann.
Natürlich benötigen Sie dennoch ein gewisses Maß an Fachwissen – welches Objekterkennungsmodell soll ausgeführt werden? Wo werden die Trainingsdaten gespeichert? Wie wird mit Inferenz umgegangen? Aber eine Handvoll Ingenieure können die Arbeit von weit mehr erledigen, und das alles an einem Ort, anstatt über ein Dutzend Tools, APIs und Code-Notizbücher verstreut zu sein.
Viso sagt, dass es sich um eine End-to-End-Lösung handelt, und das scheint keine Übertreibung zu sein. Computer Vision erfordert zunächst Daten, Schulungsprozesse, dann Implementierung, Hosting, Compliance-Arbeit usw. – und es scheint wirklich eine „Suppen-zu-Nuss“-Lösung zu sein, die all das an einem Ort vereint:
Wenn Sie also den „Busy-Detektor“ von früher erstellen würden, könnten Sie möglicherweise nur mit hundert Stunden Filmmaterial anfangen und am anderen Ende ein oder zwei Wochen später mit einem vollständigen Produkt herauskommen. Dazu gehören Low-Level-Analyse und Speicherung der Rohdaten, Anmerkungen und Kennzeichnungen, Schulung und Tests des Basismodells, Produktintegration, Online- oder Offline-Bereitstellung, Analysen, Updates und Backups sowie Zugriff und Sicherheit … alles ohne Verlassen Viso, und wahrscheinlich ohne die Semikolon- oder Klammertasten zu berühren. (Es gibt verschiedene Fallstudien Hier.)
Obwohl es andere Computer-Vision-Plattformen gibt, sagte Boesch, dass keine davon „für die Verwaltung hochkomplexer Computer-Vision-Anwendungen in großem Maßstab und deren kontinuierliche Wartung“ ausgelegt sei, sondern sich mehr auf eine Handvoll Aufgaben aus der oben genannten Liste konzentriere. Ziel von Viso ist es, so viele Modelle und Methoden, Hardware und Anwendungsfälle wie möglich zu unterstützen und gleichzeitig sicherzustellen, dass der Kunde Eigentümer des Endergebnisses ist.
Da ich selbst kein Entwickler bin, kann ich nicht sagen, wie schwierig oder einfach verschiedene Anwendungsfälle sein könnten, aber die Verwendung hat sicherlich einen grundsätzlichen Reiz (wie die Beliebtheit anderer Low-Code- und End-to-End-Tools zeigt). weniger und umfassendere Plattformen, anstatt eine Reihe unzusammenhängender Plattformen zusammenzufügen.
Die Investoren von Viso scheinen das zu glauben, und das Unternehmen hat unter der Leitung von Accel und unter Beteiligung verschiedener Angels 9,2 Millionen US-Dollar an Startkapital aufgebracht. Interessanterweise ist das Unternehmen seit seiner Gründung im Jahr 2018 in der Schweiz mit Bootstrapping ausgestattet.
Boesch sagte, dass das Unternehmen aufgrund der explodierenden Nachfrage die Erhöhung vorgenommen habe, die nach Angaben des KI-Unternehmens im Vergleich zu den angebotenen Produkten und den bestehenden Kunden recht bescheiden ausfällt. Er sagte, Viso sei bereits von mehreren großen Unternehmen übernommen worden, darunter Pricewaterhouse Cooper, DHL und Orange, und habe seit 2022 ein sechsfaches Neukundenwachstum verzeichnet.