Logran grabar en 72 mil cadenas de ADN una película, una tarjeta de amazon y mucho más

0 0

Agencias / InsurgentePress, Ciudad de México.- La humanidad podría pronto generar más datos de lo que los discos duros u otros sistemas de almacenamiento masivo puedan acoger de manera eficaz, un problema que ha hecho que los científicos presten atención al ADN, la antiquísima solución de la naturaleza para almacenar información.

En un nuevo estudio, Yaniv Erlich y Dina Zielinski, de la Universidad de Columbia en la ciudad estadounidense de Nueva York, han demostrado que un algoritmo diseñado originalmente para streaming de video en un teléfono móvil o celular puede aprovechar casi por completo el potencial de almacenamiento del ADN gracias a poder comprimir mucho más la información en él que en cualquier otro sistema artificial existente de almacenamiento de información. También han demostrado que esta tecnología es muy fiable.

El ADN constituye un medio de almacenamiento ideal porque es ultracompacto y puede durar cientos de miles de años si se le mantiene en un lugar fresco y seco, como se demostró entre 2013 y 2016 con la obtención de ADN de huesos de un antepasado humano de hace 430.000 años, encontrados en una cueva española.

Erlich y Zielinski eligieron seis archivos para codificar, o escribir, en el ADN: un sistema operativo completo de ordenador, una película francesa de 1895 (“Llegada de un tren a La Ciotat”), una tarjeta de regalo de 50 dólares de Amazon, un virus de ordenador, el contenido de una placa diseñada como mensaje para extraterrestres y que viaja a bordo de las sondas espaciales Pioneer, y un estudio de 1948 del teórico de la información Claude Shannon.

Erlich y Zielinski comprimieron los archivos en uno solo, y después dividieron los datos en secuencias cortas de código binario hecho de ceros y unos. Usando un algoritmo de corrección y borrado, empaquetaron aleatoriamente las secuencias en conjuntos denominados gotas, cartografiando los unos y los ceros de cada gota para las cuatro bases de nucleótidos en el ADN: A, G, C y T. El algoritmo excluyó combinaciones de letras conocidas por crear errores, y añadió un código de barras a cada gota para ayudar a reensamblar los archivos más tarde.

En total, generaron una lista digital de 72.000 cadenas de ADN, cada una de 200 bases de largo, y la enviaron en un archivo de texto a la compañía Twist Bioscience, de San Francisco, especializada en síntesis de ADN y en convertir datos digitales en datos biológicos. Dos semanas más tarde, recibieron un frasco conteniendo una pizca de moléculas de ADN.

Para recuperar del ADN sus archivos, utilizaron tecnología moderna de secuenciación que lee las cadenas de ADN, lo que fue seguido por el uso de un software que traduce el código genético de nuevo a código binario. Así, recuperaron sus archivos sin ningún error en absoluto.

También han demostrado que se podría crear una cantidad virtualmente ilimitada de copias con su técnica de codificación, mediante la multiplicación de su muestra de ADN a través de la reacción en cadena de la polimerasa (PCR), y que esas copias, e incluso las copias de sus copias, y así sucesivamente, pueden seguir almacenando, sin errores, la información original.
 

Parameter Church et al. (3) Goldman et al. (4) Grass et al. (5) Bornholt et al. (6) Blawat et al. (7) This work
Input data (Mbytes) 0.65 0.75 0.08 0.15 22 2.15
Coding potential (bits/nt) 1 1.58 1.78 1.58 1.6 1.98
Redundancy 1 4 1 1.5 1.13 1.07
Robustness to dropouts No Repetition RS Repetition RS Fountain
Error correction/detection No Yes Yes No Yes Yes
Full recovery No No Yes No Yes Yes
Net information density (bits/nt) 0.83 0.33 1.14 0.88 0.92 1.57
Realized capacity 45% 18% 62% 48% 50% 86%
Number of oligos 54,898 153,335 4,991 151,000 1,000,000 72,000
Physical density (Pbytes/g) 1.28 2.25 25 214

 

Fuente: Revista Science.