Stellen Sie sich Bachs „Cellosuite Nr. 1“ vor, gespielt auf einem DNA-Strang.
Dieses Szenario ist nicht so unmöglich, wie es scheint. DNA ist zu klein, um einem rhythmischen Schlagen oder einer gleitenden Bogensehne standzuhalten, und ist ein Kraftpaket zum Speichern von Audiodateien und allen Arten anderer Medien.
„DNA ist das ursprüngliche Datenspeichersystem der Natur. Wir können damit jede Art von Daten speichern: Bilder, Videos, Musik – alles“, sagte Kasra Tabatabaei, Forscherin am Beckman Institute for Advanced Science and Technology und Mitautorin von diese Studie.
Die Erweiterung des molekularen Aufbaus der DNA und die Entwicklung einer präzisen neuen Sequenzierungsmethode ermöglichten es einem Team aus mehreren Institutionen, die Doppelhelix in eine robuste, nachhaltige Datenspeicherplattform umzuwandeln.
Die Zeitung des Teams erschien in Nano-Buchstaben im Februar 2022.
Im Zeitalter digitaler Informationen spürt jeder, der mutig genug ist, durch die täglichen Nachrichten zu navigieren, dass das globale Archiv von Tag zu Tag schwerer wird. Papierakten werden zunehmend digitalisiert, um Platz zu sparen und Informationen vor Naturkatastrophen zu schützen.
Von Wissenschaftlern bis hin zu Social-Media-Influencern, jeder, der Informationen zu speichern hat, profitiert von einer sicheren, nachhaltigen Daten-Lockbox – und die Doppelhelix ist genau das Richtige für Sie.
„DNA ist eine der besten Optionen, wenn nicht sogar die beste Option, um insbesondere Archivdaten zu speichern“, sagte Chao Pan, Doktorand an der University of Illinois Urbana-Champaign und Co-Autor dieser Studie.
Aufgrund ihrer Langlebigkeit, die nur durch Widerstandsfähigkeit übertroffen wird, ist die DNA darauf ausgelegt, die härtesten Bedingungen der Erde zu überstehen – manchmal für Zehntausende von Jahren – und eine brauchbare Datenquelle zu bleiben. Wissenschaftler können versteinerte Stränge sequenzieren, um genetische Geschichten aufzudecken und längst verlorenen Landschaften Leben einzuhauchen.
Trotz ihrer geringen Statur ist DNA ein bisschen wie Dr. Whos berüchtigter Polizeikasten: innen größer, als es den Anschein hat.
„Jeden Tag werden mehrere Petabyte an Daten im Internet generiert. Nur ein Gramm DNA würde ausreichen, um diese Daten zu speichern. So dicht ist DNA als Speichermedium“, sagt Tabatabaei, der ebenfalls im fünften Jahr promoviert. D. Schüler.
Ein weiterer wichtiger Aspekt der DNA ist ihre natürliche Fülle und nahezu unendliche Erneuerbarkeit, eine Eigenschaft, die die fortschrittlichsten Datenspeichersysteme auf dem heutigen Markt nicht teilen: Silizium-Mikrochips, die oft nur Jahrzehnte im Umlauf sind, bevor sie kurzerhand auf einem Haufen deponierter e -Abfall.
„In einer Zeit, in der wir vor beispiellosen Klimaherausforderungen stehen, kann die Bedeutung nachhaltiger Speichertechnologien nicht hoch genug eingeschätzt werden. Neue, grüne Technologien für die DNA-Aufzeichnung entstehen, die die molekulare Speicherung in Zukunft noch wichtiger machen werden“, sagte Olgica Milenkovic, The Franklin W. Woeltge Professor für Elektrotechnik und Informationstechnik und Co-PI der Studie.
Das interdisziplinäre Team stellte sich die Zukunft der Datenspeicherung vor und untersuchte die jahrtausendealte MO der DNA. Dann fügten die Forscher ihre eigene Wendung des 21. Jahrhunderts hinzu.
In der Natur enthält jeder DNA-Strang vier Chemikalien – Adenin, Guanin, Cytosin und Thymin –, die oft mit den Initialen A, G, C und T bezeichnet werden. Sie ordnen sich entlang der Doppelhelix an und ordnen sich neu zu Kombinationen an, die Wissenschaftler entschlüsseln können , oder Sequenz, um Bedeutung zu machen.
Die Forscher erweiterten die bereits breite Kapazität der DNA zur Informationsspeicherung, indem sie der bestehenden Vier-Buchstaben-Reihe sieben synthetische Nukleobasen hinzufügten.
„Stellen Sie sich das englische Alphabet vor. Wenn Sie nur vier Buchstaben zur Verfügung hätten, könnten Sie nur so viele Wörter erstellen. Wenn Sie das vollständige Alphabet hätten, könnten Sie unbegrenzte Wortkombinationen erstellen. Dasselbe gilt für DNA. Anstatt Nullen und Einsen in umzuwandeln A, G, C und T, wir können Nullen und Einsen in A, G, C, T und die sieben neuen Buchstaben des Speicheralphabets umwandeln“, sagte Tabatabaei.
Da dieses Team das erste ist, das chemisch modifizierte Nukleotide für die Informationsspeicherung in DNA verwendet, haben die Mitglieder eine einzigartige Herausforderung gemeistert: Nicht alle aktuellen Technologien sind in der Lage, chemisch modifizierte DNA-Stränge zu interpretieren. Um dieses Problem zu lösen, kombinierten sie maschinelles Lernen und künstliche Intelligenz, um eine einzigartige Verarbeitungsmethode zum Auslesen von DNA-Sequenzen zu entwickeln.
Ihre Lösung kann modifizierte Chemikalien von natürlichen unterscheiden und jedes der sieben neuen Moleküle voneinander unterscheiden.
„Wir haben 77 verschiedene Kombinationen der 11 Nukleotide ausprobiert, und unsere Methode war in der Lage, jede von ihnen perfekt zu unterscheiden“, sagte Pan. „Das Deep-Learning-Framework als Teil unserer Methode zur Identifizierung verschiedener Nukleotide ist universell, was die Verallgemeinerung unseres Ansatzes auf viele andere Anwendungen ermöglicht.“
Diese buchstabengetreue Übersetzung ist Nanoporen zu verdanken: Proteinen mit einer Öffnung in der Mitte, durch die ein DNA-Strang leicht passieren kann. Bemerkenswerterweise fand das Team heraus, dass Nanoporen jede einzelne Monomereinheit entlang des DNA-Strangs erkennen und unterscheiden können – unabhängig davon, ob die Einheiten natürlichen oder chemischen Ursprungs sind.
„Diese Arbeit liefert einen spannenden Beweis des Prinzips der Erweiterung der makromolekularen Datenspeicherung auf nicht-natürliche Chemien, die das Potenzial haben, die Speicherdichte in nicht-traditionellen Speichermedien drastisch zu erhöhen“, sagte Charles Schroeder, James Economy Professor of Materials Wissenschaft und Technik und ein Co-PI für diese Studie.
DNA hat buchstäblich Geschichte geschrieben, indem sie genetische Informationen gespeichert hat. So wie diese Studie aussieht, ist die Zukunft der Datenspeicherung genauso doppelhelikal.
S. Kasra Tabatabaei et al., Erweiterung des molekularen Alphabets DNA-basierter Datenspeichersysteme mit Neural Network Nanopore Readout Processing, Nano-Buchstaben (2022). DOI: 10.1021/acs.nanolett.1c04203