Immer größere Datenmengen erfordern eine Speicherung, oft über lange Zeiträume. Synthetische Polymere sind eine Alternative zu herkömmlichen Speichermedien, da sie gespeicherte Informationen beibehalten und gleichzeitig weniger Platz und Energie verbrauchen. Allerdings begrenzt die Datengewinnung mittels Massenspektrometrie die Länge und damit die Speicherkapazität einzelner Polymerketten.
Im Tagebuch Angewandte Chemie Internationale AusgabeForscher haben eine Methode eingeführt, die diese Einschränkung überwindet und den direkten Zugriff auf bestimmte Bits ermöglicht, ohne die gesamte Kette zu lesen.
Es fallen ständig Daten an, die aus Geschäftstransaktionen, Prozessüberwachung, Qualitätssicherung oder der Verfolgung von Produktchargen resultieren. Die jahrzehntelange Archivierung dieser Daten erfordert viel Platz und Energie. Für die Langzeitarchivierung großer Datenmengen, auf die selten zugegriffen werden muss, sind Makromoleküle mit einer definierten Sequenz, wie DNA und synthetische Polymere, eine attraktive Alternative.
Synthetische Polymere haben gegenüber DNA Vorteile: einfache Synthese, höhere Speicherdichte und Stabilität unter rauen Bedingungen. Ihr Nachteil besteht darin, dass die in Polymeren kodierten Informationen durch Massenspektrometrie (MS) oder Tandem-Massensequenzierung (MS2) entschlüsselt werden. Für diese Methoden muss die Größe der Moleküle begrenzt werden, was die Speicherkapazität jeder Polymerkette stark einschränkt.
Darüber hinaus muss die gesamte Kette der Reihe nach, Baustein für Baustein, dekodiert werden – auf die interessierenden Bits kann nicht direkt zugegriffen werden. Es ist, als müsste man ein ganzes Buch durchlesen, anstatt es nur auf der entsprechenden Seite aufzuschlagen. Im Gegensatz dazu können lange DNA-Ketten in Fragmente zufälliger Länge geschnitten, einzeln sequenziert und dann rechnerisch in die ursprüngliche Sequenz rekonstruiert werden.
Kyoung Taek Kim und sein Team am Department of Chemistry der Seoul National University haben eine neue Methode entwickelt, mit der sehr lange synthetische Polymerketten, deren Molekulargewichte die analytischen Grenzen von MS und MS2 bei weitem überschreiten, effizient entschlüsselt werden können.
Zur Demonstration kodierte das Team seine Universitätsadresse in ASCII und übersetzte diese zusammen mit einem Fehlererkennungscode (CRC, eine etablierte Methode zur Gewährleistung der Datenintegrität) in einen Binärcode, eine Folge von Einsen und Nullen.
Diese 512-Bit-Sequenz wurde in einer Polymerkette aus zwei verschiedenen Monomeren gespeichert: Milchsäure zur Darstellung einer 1 und Phenylmilchsäure zur Darstellung einer 0. In unregelmäßigen Abständen enthielten sie auch Fragmentierungscodes, die Mandelsäure enthielten. Bei chemischer Aktivierung brechen die Ketten an diesen Stellen.
Bei ihrer Demonstration erhielten sie 18 Fragmente unterschiedlicher Größe, die durch MS2-Sequenzierung einzeln entschlüsselt werden konnten.
Eine speziell entwickelte Software identifizierte die Fragmente zunächst anhand ihrer Masse und ihrer Endgruppen, wie die MS-Spektren zeigen. Während des MS2-Prozesses zerfallen zuvor gemessene Molekülionen weiter, und diese Stücke wurden anschließend ebenfalls analysiert.
Die Fragmente konnten anhand des Massenunterschieds der Stücke sequenziert werden. Mit Hilfe des CRC-Fehlererkennungscodes rekonstruierte die Software die Reihenfolge der gesamten Kette und überwand damit die Längenbeschränkung für die Polymerketten.
Das Team war auch in der Lage, interessante Teile zu entschlüsseln, ohne die gesamte Polymerkette zu sequenzieren (Random Access), wie zum Beispiel das Wort „Chemie“ im Code für ihre Adresse.
Indem sie berücksichtigten, dass die Teile ihrer Adresse alle in einer bestimmten Reihenfolge (Abteilung, Institution, Stadt, Postleitzahl, Land) und durch Kommas getrennt vorliegen, konnten sie den Ort isolieren, an dem die gewünschten Informationen innerhalb der Kette gespeichert waren und sequenzierte nur die relevanten Fragmente.
Weitere Informationen:
Heejeong Jang et al., Shotgun-Sequenzierung von 512-mer-Copolyester ermöglicht wahlfreien Zugriff auf gespeicherte Informationen, Angewandte Chemie Internationale Ausgabe (2024). DOI: 10.1002/ange.202415124