KI findet Rassenbeschränkungen in Millionen von Eigentumsunterlagen

Nach kalifornischem Recht sind die Bezirke verpflichtet, rassistisch einschränkende Formulierungen – die seit 1948 verfassungsrechtlich nicht durchsetzbar sind – aus Eigentumsurkunden zu streichen. Um zu helfen, trainierten die Forscher ein großes Sprachmodell.

Als Dan Ho ein Haus in Palo Alto kaufte, erzählt er: „Wir mussten Papiere unterschreiben, die besagten, dass das Grundstück nicht von Personen afrikanischer, japanischer, chinesischer oder mongolischer Abstammung genutzt oder bewohnt werden darf, mit Ausnahme der Kapazität.“ eines Dieners einer weißen Person.

„Es war ein beeindruckendes Zeugnis der Wohnungsdiskriminierung in der Region und seit 1948 verfassungsrechtlich nicht durchsetzbar“, sagte Ho, William Benjamin Scott und Luna M. Scott Professor für Recht, Direktor des RegLab und Senior Fellow an der Stanford University Human-Centered Künstliche Intelligenz oder HAI.

Obwohl der Oberste Gerichtshof solche Klauseln für nicht durchsetzbar hält, verunreinigen rassistisch einschränkende Vereinbarungen immer noch Urkunden im ganzen Land.

Im Jahr 2021 erließ Kalifornien ein Gesetz, das die 58 Bezirke des Bundesstaates dazu verpflichtete, Programme zur Identifizierung und Schwärzung von Urkundenaufzeichnungen zu erstellen, die Rassenbündnisse enthalten.

Aber das neue Gesetz stellt auch eine gewaltige Aufgabe dar: Allein im Santa Clara County gibt es 24 Millionen Urkundendokumente mit insgesamt 84 Millionen Seiten aus dem Jahr 1850. „Vor dieser Zusammenarbeit hat unser Team über Wochen hinweg fast 100.000 Seiten manuell gelesen, um Rassenabkommen zu identifizieren.“ „, sagte der stellvertretende County Clerk-Recorder Louis Chiaramonte, „und es war ein herausforderndes Unterfangen.“

Um das Gesetz einzuhalten, haben einige kalifornische Bezirke Verträge mit kommerziellen Anbietern geschlossen. Los Angeles County beispielsweise beauftragte ein Unternehmen für 8 Millionen US-Dollar damit, diesen Scan über einen Zeitraum von sieben Jahren durchzuführen. In anderen Gerichtsbarkeiten haben Bürgerteams diese Bemühungen tapfer durch Crowdsourcing mit Tausenden von Freiwilligen finanziert, die sich mit Urkundenunterlagen befassen. Aber nicht alle Gerichtsbarkeiten verfügen über solche Ressourcen.

Die Grafschaft Santa Clara, die Heimat des Silicon Valley, ging dies anders an. Das Regulation, Evaluation, and Governance Lab (RegLab) der Stanford University hat sich mit dem County zusammengetan, um die Leistungsfähigkeit der KI – und insbesondere großer Sprachmodelle – zu nutzen, um diese monumentale Aufgabe zu unterstützen.

„Der Landkreis Santa Clara hat proaktiv Millionen von Dokumenten durchgesehen, um diskriminierende Formulierungen aus den Eigentumsunterlagen zu entfernen“, sagte Chief Operating Officer Greta Hansen. „Wir sind dankbar für unsere Partnerschaft mit Stanford, die dem Landkreis dabei geholfen hat, diesen Prozess erheblich zu beschleunigen und so Steuergelder und Personalzeit zu sparen.“

Das Team unter der Leitung von Stanfords RegLab und unter Beteiligung von HAI-Partnern und dem Princeton-Professor Peter Henderson kuratierte eine Sammlung von Rassenbündnissen aus verschiedenen Gerichtsbarkeiten des Landes und trainierte ein hochmodernes offenes Sprachmodell zur Erkennung von Rassenbündnissen, das nahezu perfekt ist Genauigkeit.

Das Team hat das Papier unter veröffentlicht https://reglab.github.io/racialcovenants/ und stellt das Modell zur Verfügung, um allen Gerichtsbarkeiten, die vor dieser Aufgabe stehen, die Möglichkeit zu geben, historische Register von Rassenbündnissen effektiver zu identifizieren, zu redigieren und zu entwickeln.

„Wir schätzen, dass dieses System 86.500 Arbeitsstunden einspart und weniger als 2 % der Kosten vergleichbarer proprietärer Modelle kostet“, sagte Co-Hauptautor Faiz Surani, Mitglied des RegLab. Das Team untersuchte 5,2 Millionen Urkundenaufzeichnungen zwischen 1902 und 1980, dem Zeitraum, der am meisten in Frage stand.

Das Team fand außerdem eine Möglichkeit, historische Karten mit Querverweisen zu versehen, um die meisten dieser Grundstücke zu lokalisieren. Sie stimmten mit Textbeschreibungen von Karten überein (z. B. „Karte [that] wurde am 6. Juni 1896 im Buch „I“ der Landkarten auf Seite 25 aufgezeichnet.

„Bei all den Punkten, die sich aus dem Staatsgesetz ergaben, dachten wir, dass eine Kartierung nahezu unmöglich gewesen wäre“, sagte Chiaramonte.

Diese Karten enthüllten außergewöhnliche Einblicke in die Entwicklung und Verbreitung von Rassenbündnissen im Santa Clara County:

  • Das Team schätzte, dass ab 1950 jedes vierte Grundstück im Santa Clara County Rassenabkommen unterlag.
  • Nur zehn Entwickler waren für ein Drittel der identifizierten Vereinbarungen verantwortlich, was darauf hindeutet, dass die Entwickler viel Einfluss auf den Bau des Santa Clara County hatten.
  • Rassenabkommen schlossen Afroamerikaner im gleichen Maße aus wie asiatische Amerikaner, selbst wenn die afroamerikanische Bevölkerung weniger als ein Zehntel so groß war wie die asiatisch-amerikanische Bevölkerung.
  • Das Team fand ein bemerkenswertes Beispiel eines Friedhofs im Besitz von San Jose, auf dem Bestattungsurkunden nur für „Kaukasier“ vorhanden waren. Dies widerspricht der konventionellen historischen Darstellung, dass Rassenvereinbarungen nur zwischen privaten Parteien geschlossen wurden, nachdem der Oberste Gerichtshof die staatliche Rassenzoneneinteilung verboten hatte.
  • „Wir glauben, dass dies ein überzeugendes Beispiel für die Zusammenarbeit zwischen Wissenschaft und Regierung ist, um diese Art von gesetzgeberischem Mandat viel einfacher zu erreichen und ein Licht auf historische Muster der Wohnungsdiskriminierung zu werfen“, sagte Co-Leiter Mirac Suzgun, ein JD/Ph. D. Student der Informatik.

    Chiaramonte stimmte zu: „Diese Zusammenarbeit ebnete einen neuen Weg dafür, wie wir Technologie nutzen können, um den bedeutsamen Auftrag zur Identifizierung, Kartierung und Schwärzung von Rassenbündnissen zu erfüllen. Dadurch verkürzte sich die Zeit, die unser Team für die Durchsicht historischer Dokumente benötigte, erheblich.“

    Weitere Informationen:
    KI zur Skalierung von Rechtsreformen: Kartierung und Schwärzung von Rassenabkommen im Santa Clara County

    Bereitgestellt von der Stanford University

    ph-tech