Hammerspace erhält 56 Millionen US-Dollar für einen neuen Ansatz zur Arbeit mit großen Mengen unstrukturierter Daten

Daten mögen „das neue Öl“ sein, aber nur, wenn sie gefördert und genutzt werden können. Heute rief ein fünf Jahre altes Startup an Hammerraum Das gibt jede Art von Daten, die Leben einhauchen, kündigt eine Finanzierung in Höhe von 56 Millionen US-Dollar an – seine erste institutionelle Investition –, während es sein Geschäft ausbaut.

Prosperity7 Ventures – der Venture-Arm von Saudi Aramco – führt diese erste externe Runde an, an der sich auch ARK Invest, Pier 88 Hedge Fund, Samsung und andere ungenannte Investoren beteiligen.

Hammerspace wurde ursprünglich von finanziert, mitbegründet und geleitet David Flynn, der Pionier der Technik, bekannt für seine frühen Arbeiten zu Linux, Supercomputern und Flash-Computing. Und obwohl es vielleicht kein bekannter Name ist, arbeitet es bereits mit einer Reihe sehr großer Unternehmen und Organisationen zusammen, die einen riesigen Datenbedarf haben.

Zu seinen Kunden zählen Jeff Bezos‘ Blue Origin; die National Science Foundation; und Royal Caribbean Group. Große Medienkonzerne verwenden es auch, um ihre Daten rund um die Entwicklung von Spezialeffekten zu verwalten (es wurde unter anderem für Effekte in Star Wars und Stranger Things verwendet). Und mindestens ein „Super-Scaler“, in den Worten von Flynn, den er nicht nennen möchte, nutzt Hammerspace, um Unmengen unstrukturierter Daten zu verwalten, die derzeit für den Aufbau und das Training großer Sprachmodelle auf Zehntausenden von GPUs verwendet werden. (Hinweis: Aufgrund seiner Reaktion auf einen Namen, den ich ihm gegeben habe, und den anderen Partnern, mit denen Hammerspace zusammenarbeitet, habe ich eine starke Vermutung darüber, um wen es sich handelt.)

„Wenn Sie viel Geld für GPU-Leistung ausgeben, ist das Letzte, was Sie wollen, dass dieser Standort ungenutzt bleibt und darauf wartet, dass Daten in diese Systeme ein- und ausfließen“, sagte Flynn. „Wir liefern radikalen Input, um Daten in und aus diesen Trainingssystemen einzuspeisen. Es handelt sich um eine Datenpipeline, die diese Modelle mit hoher Geschwindigkeit und mit dem Komfort eines echten Dateisystems ein- und ausspeist.“

Hammerspace ist nach ihm benannt das Konzept Es entstand ursprünglich aus Zeichentrickfilmen und Comics, in denen Charaktere Objekte, die sie benötigen, aus dem Nichts hervorholen, und ohne zu technisch zu werden, könnte dies auch die beste Art sein, zu erklären, was das Startup tut. Im Wesentlichen bietet es eine Möglichkeit, große Datenmengen – unabhängig davon, wo sie sich befinden oder wie sie verwendet werden – einem Unternehmen genau dann zugänglich und verfügbar zu machen, wenn es sie benötigt, und sie aus dem Weg zu räumen, wenn dies nicht der Fall ist.

Flynn lehnte es zunächst ab, das Startup als im Bereich Datenorchestrierung, Dateiverwaltung, Pipeline oder Datenverwaltung zu beschreiben – er ist sehr sympathisch und zugänglich, aber auch schnell technisch und daher sehr genau in seiner Sprache – aber Ehrlich gesagt deckt es all dies bis zu einem gewissen Grad ab.

Unternehmen, die in einem Projekt wie dem Aufbau einer neuen KI große Datenmengen verwenden müssen, werden es in der Regel als Herausforderung empfinden, auf die benötigten Daten zuzugreifen und sie zu verwalten, nicht nur wegen der schieren Menge, sondern auch, weil sie unstrukturiert sind und auch in vielen Fällen vorhanden sind Verschiedene Orte, über Clouds, lokale Server und mehr hinweg – hybride Architekturen für sehr unübersichtliche Informationsmengen.

Obwohl Unternehmen wie Snowflake es sich zur Aufgabe gemacht haben, strukturierte Daten in solchen Architekturen für Zwecke der Business Intelligence gut zu verwalten, gilt dies nicht für die unstrukturierten Datensätze, auf die sich Hammerspace spezialisiert hat, und für die Arten von Anwendungen, in denen diese Art von Daten verwendet wird für, die Business Intelligence umfassen kann, aber auch für die KI-Verarbeitung geeignet sein könnte.

Hammerspaces technologischer Durchbruch bei der Bewältigung dieses Problems ist zum Teil Flynns frühzeitiger Erkenntnis zu verdanken, dass dies ein Problem für spätere Unternehmen darstellen würde, als er bei Fusion.io an Flash-Speicher arbeitete. Und zum Teil ist es der grundlegenden Arbeit seines Mitbegründers und CTO zu verdanken, Trond Myklebust, selbst eine Art Legende in der Computerwelt, unter anderem als Betreuer und Hauptentwickler des Linux-Kernel-NFS-Clients. Das „Dateisystem“, das Hammerspace zum Verwalten, Verschieben und Orchestrieren von Daten entwickelt hat, basiert auf einer bestimmten Implementierung in Linux; und was es leistet, sagte Flynn, „ist einzigartig in der Branche.“

Man geht davon aus, dass in der Unstrukturierung potenziell die Geschäftsmöglichkeiten für diese und weitere Anwendungen liegen. Hammerspace zitiert Daten von IDC, die davon ausgehen, dass mehr als 90 % der Geschäftsinformationen „bis 2025 wahrscheinlich aus unstrukturierten Daten bestehen werden“. Und das ist zum Teil der Grund, warum Investoren interessiert sind.

„Die Informationen unserer Welt sind zunehmend dezentralisiert und Unternehmen müssen heute mehr denn je auf unstrukturierte Daten zugreifen und diese aus Silos und über Plattformen hinweg verschieben, um diese Daten nützlicher und wertvoller zu machen“, sagte Cathie Wood, CEO von ARK Invest. in einer Stellungnahme. „Unsere Mission ist es, die technologische Konvergenz zwischen Märkten und Branchen zu nutzen und so die Art und Weise zu verändern, wie die Welt funktioniert. Hammerspace folgt dieser Mission und ermöglicht die Erschließung neuer Innovationen im gesamten Unternehmen.“

tch-1-tech