HoundDog.ai hilft Entwicklern, die Offenlegung persönlicher Daten zu verhindern

HoundDogai hilft Entwicklern die Offenlegung persoenlicher Daten zu verhindern

HoundDog.ai, ein Startup, das Entwicklern dabei hilft, sicherzustellen, dass ihr Code keine personenbezogenen Daten (PII) preisgibt, kam am Mittwoch aus der Tarnung und kündigte eine Seed-Runde im Wert von 3,1 Millionen US-Dollar an, angeführt von E14, Mozilla Ventures und ex/ante sowie einer Reihe von Angel-Investoren. Im Gegensatz zu anderen Scan-Tools untersucht HoundDog tatsächlich den Code, den ein Entwickler schreibt, und verwendet dabei sowohl den herkömmlichen Mustervergleich als auch große Sprachmodelle (LLMs), um potenzielle Probleme zu finden.

HoundDog wurde gegründet von Amjad Afanah, der zuvor DCHQ mitbegründet hatte, das später von Gridstore übernommen wurde (das, um die Sache noch komplizierter zu machen, seinen Namen dann in HyperGrid änderte) im Jahr 2016. Afanah war außerdem Mitbegründer von apisec.ai, das immer noch aktiv ist, und arbeitete bei selbstfahrendes Startup Cruise. Die Inspiration für HoundDog kam während seiner Zeit beim Datensicherheits-Startup Cyral und bei Gesprächen mit Datenschutzteams dort, erzählte er mir.

Bildnachweis: HoundDog.ai

„Als ich bei Cyral war, hatten wir eine Menge Daten“, sagte er. „Cyral konzentriert sich – wie viele andere im Bereich Datensicherheit – auf Produktionssysteme. Sie helfen Ihnen, Ihre strukturierten Daten und Ihre Datenbanken zu entdecken und zu klassifizieren und dann Zugriffskontrollen anzuwenden. Aber das überwältigende Feedback, das ich immer wieder von Sicherheits- und Datenschutzteams gleichermaßen bekam, war: ‚Wissen Sie, es ist ein bisschen zu reaktiv und hält nicht mit den Änderungen in der Codebasis Schritt.‘“

HoundDog verschiebt diesen Prozess also noch weiter nach links. Zwar befindet es sich noch im kontinuierlichen Integrationsfluss und noch nicht in der Entwicklungsumgebung (obwohl dies in Zukunft passieren könnte), aber die Idee besteht darin, potenzielle Datenlecks zu finden, bevor der Code zusammengeführt wird. Und das Wichtigste dabei ist, dass HoundDog den eigentlichen Code untersucht und nicht den Datenfluss, den er erzeugt. „Unsere Quelle der Wahrheit ist die Codebasis“, sagte Afanah.

HoundDogai hilft Entwicklern die Offenlegung persoenlicher Daten zu verhindern
Bildnachweis: HoundDog.ai

Wenn ein Entwicklungsteam beispielsweise damit beginnt, Sozialversicherungsnummern zu sammeln, würde HoundDog eine Flagge hissen und das Team darüber warnen, bevor der Code jemals zusammengeführt wird; es würde auch das Sicherheitsteam alarmieren. Das könnte schließlich doch ein großes – und kostspieliges – Problem sein.

Der Dienst unterstützt derzeit in Java, C#, JavaScript und TypeScript geschriebenen Code sowie SQL-, GraphQL- und OpenAPI/Swagger-Abfragen. Die Unterstützung für Python stehe unmittelbar bevor, sagt das Unternehmen.

Afanah merkte an, dass ein solches Tool im Zeitalter von KI-generiertem Code besonders wichtig wird, was auch Amjad Masad, CEO von Replit (und Angel-Investor von HoundDog), unterstützte.

„Da immer mehr Unternehmen auf KI-generierten Code zurückgreifen, um die Entwicklung zu beschleunigen, wird die Einbettung bewährter Sicherheitspraktiken und die Gewährleistung der Sicherheit des generierten Codes von entscheidender Bedeutung“, sagte Masad. „HoundDog.ai ist führend bei der Sicherung personenbezogener Daten zu Beginn des Entwicklungszyklus und macht sie zu einem unverzichtbaren Bestandteil jedes Workflows zur KI-Codegenerierung. Aus diesem Grund habe ich mich entschieden, in dieses Unternehmen zu investieren.“

HoundDog selbst verwendet jedoch auch KI. Derzeit stützt es sich dabei auf die Modelle von OpenAI, es ist jedoch wichtig zu betonen, dass dies optional ist. Benutzer, die befürchten, dass ihr Code ihre privaten Repositorys verlässt, können sich auch dafür entscheiden, nur auf den traditionelleren Codescanner des Unternehmens zu vertrauen.

Ein wesentlicher Teil des Wertversprechens von HoundDog besteht darin, dass es dank seiner automatisierten Berichtsfunktionen die Compliance-Kosten für Startups senken kann. Der Dienst kann automatisch ein Verzeichnis der Verarbeitungstätigkeiten (RoPA) erstellen. Zu diesem Zweck verwendet HoundDog generative KI, um diese Berichte zu erstellen, und sendet diese Daten an OpenAI. Das Team betont, dass nur die Token, die der Dienst über seinen regulären Scanner entdeckt hat, an OpenAI weitergegeben werden und dass der eigentliche Quellcode nicht weitergegeben wird.

Das Unternehmen bietet a begrenzter kostenloser Planmit kostenpflichtigen Plänen ab 200 $/Monat für das Scannen von bis zu zwei Repos.

tch-1-tech