Bessere Daten, ein in Singapur ansässiges Startup, das programmierbare synthetische Daten verwendet, um echte Daten zu schützen, gab heute bekannt, dass es 1,55 Millionen US-Dollar gesammelt hat. Die Seed-Runde, die angeblich überzeichnet war, wurde von Investible mit Beteiligung von Franklin Templeton, Xcel Next, der Singapore University of Technology and Design, Bon Auxilium, Tenity, Plug and Play und Entrepreneur First geleitet.
Das Startup wurde 2021 von Dr. Uzair Javaid, seinem CEO, und Cheftechnologen Kevin Yee mit dem Ziel gegründet, den Datenaustausch angesichts der weltweit zunehmenden Datenschutzbestimmungen schneller und sicherer zu machen. Das Unternehmen unterhält derzeit Forschungs- und Entwicklungspartnerschaften mit zwei großen Universitäten in Singapur und den Vereinigten Staaten (es kann nicht öffentlich bekannt geben, wer sie sind), und zu seinen Kunden gehört die Shanghai Pudong Development Bank.
Betterdata sagt, dass es sich von traditionellen Datenaustauschmethoden unterscheidet, die Datenanonymisierung verwenden, um Daten zu zerstören, weil es stattdessen generative KI und Datenschutztechnik verwendet.
Yee erklärte gegenüber Tech, dass programmatische synthetische Daten generative Modelle verwenden, wie Deep-Learning-Modelle, einschließlich generativer gegnerischer Modelle, die in Deepfakes verwendet werden, Transformatoren, die in ChatGPT verwendet werden, und Diffusionsmodelle, die in stabiler Diffusion verwendet werden, um neue Datensätze zu erstellen und zu erweitern.
Diese synthetischen Datensätze haben ähnliche Eigenschaften und Strukturen wie reale Daten, ohne sensible oder private Informationen über Einzelpersonen preiszugeben.
„Die Idee ist, eine fiktive Version eines echten Datensatzes zu erstellen, der sicher für eine Vielzahl von Zwecken verwendet werden kann, darunter der Schutz vertraulicher Daten, die Verringerung von Vorurteilen und auch die Verbesserung von Modellen für maschinelles Lernen“, sagte er.
Programmatische synthetische Daten helfen Entwicklern in vielerlei Hinsicht. Einige Beispiele sind die Unterstützung beim Schutz sensibler Daten, der Einhaltung von Datenschutzbestimmungen wie GDPR und HIPAA, der Erhöhung der Datenverfügbarkeit zwischen Teams, der Erstellung von mehr Daten zum Trainieren, Testen und Validieren von Modellen für maschinelles Lernen und der Behebung von Datenungleichgewichtsproblemen durch die Erstellung von mehr Datensätzen für unterrepräsentierte Gruppen oder Klassen.
Die Finanzierung von Betterdata wird für die Produkteinführung und die Verbesserung seines programmierbaren synthetischen Daten-Tech-Stacks verwendet, einschließlich der Unterstützung von Einzeltabellen-, Mehrtabellen- und Zeitreihen-Datensätzen. Dies sind verschiedene Variationen von tabellarischen Datensätzen und Yee erklärt, dass die Hauptunterschiede in ihren Strukturen und den Problemen liegen, die sie angehen sollen.
Beispielsweise konzentrieren sich Einzeltabellen-Datasets auf eigenständige Tabellen, während Multitabellen-Datasets Beziehungen zwischen mehreren Tabellen berücksichtigen sollen und Zeitreihen-Datasets sich mit Daten befassen, die im Laufe der Zeit gesammelt wurden.
Betterdata plant außerdem, mehr Mitarbeiter einzustellen, darunter Vertriebs- und Marketingmitarbeiter, und in den nächsten ein bis zwei Jahren über Singapur hinaus in weitere Regionen im asiatisch-pazifischen Raum zu expandieren.
In einer Erklärung über die Investition von Investible sagte Direktor Khairu Rejal: „Betterdata löst eines der größten Probleme, mit denen die KI-Branche heute konfrontiert ist: den Mangel an qualitativ hochwertigen Daten, die auch die Datenschutzanforderungen erfüllen. Über seine leistungsstarke Plattform generiert Betterdata synthetische Daten, die Daten aus der realen Welt nachahmen, ohne die Qualität und den Datenschutz zu beeinträchtigen, und hilft Unternehmen dabei, globale Compliance- und Datenschutzgesetze in großem Maßstab einzuhalten.“