Droga de crisis de píxeles

Pensemos en ello: si la Tierra se enfrenta a un desastre interestelar devastador inminente y los humanos quieren preservar la vida y la civilización en la Tierra tanto como sea posible, ¿qué debemos hacer en las condiciones actuales?

Quizás sea demasiado tarde para detener la rotación de la Tierra y escapar del sistema solar como lo hizo Liu. Y si todos los seres humanos, animales, plantas y conocimientos humanos fueran transportados a una nave espacial como el Arca de Noé, la capacidad de carga existente del cohete tal vez no fuera capaz de transportar una milmillonésima parte de estos materiales.

Si desea preservar tantos organismos como sea posible durante el mayor tiempo posible, solo necesita recopilar y empaquetar la información de la secuencia de ADN de todas las especies, que se puede preservar durante cientos de miles de años en el ambiente de baja temperatura de la nave espacial; y la información de la civilización humana ¿Tela de lana? Sabemos que la forma más eficiente de esta información son los datos, y estos datos se almacenan principalmente en discos duros y discos ópticos.

Teniendo en cuenta el peso y la densidad de datos de estos dispositivos de almacenamiento en disco duro, tenemos que mantenernos alejados. Es más, es posible que los datos se pierdan debido a la muerte del disco duro o del disco óptico antes de que la nave espacial escape del sistema solar.

¿Se puede utilizar el ADN como disco duro para almacenar información de datos? La respuesta es sí.

El ADN es definitivamente la herramienta de almacenamiento de información sobre vida más antigua del planeta. También se puede utilizar como medio de almacenamiento de información de datos. Su densidad de almacenamiento y vida útil superan con creces las soluciones de almacenamiento en disco existentes. Por lo tanto, los humanos consideran que el almacenamiento de ADN es el futuro del almacenamiento de datos y la mejor alternativa para salvar a la humanidad de la crisis del almacenamiento de datos.

¿Cómo funciona el almacenamiento de ADN? ¿A qué etapa se ha llegado ahora? ¿Cuáles son las barreras a la comercialización? Esto requiere que respondamos uno por uno.

Antes de comprender cómo funciona el almacenamiento de ADN, comprendamos brevemente los principios de las dos soluciones existentes, el almacenamiento magnético y el almacenamiento óptico.

El principio del almacenamiento magnético es recubrir un material metálico con una capa de medio magnético, que forma un efecto electromagnético cuando se energiza, almacenando y expresando así 0101 información binaria. La ventaja de un disco duro de almacenamiento magnético es la rápida velocidad de entrada y lectura, pero la desventaja es que la densidad de datos es menor que el volumen y el peso. Después de 60 años de desarrollo, es posible almacenar 3 TB de datos en un disco duro de 3,5 pulgadas.

El principio del almacenamiento óptico es grabar vídeo y audio codificados digitalmente en ranuras en la superficie de un disco y luego utilizar láseres para leer los datos en estas ranuras para su almacenamiento o reproducción. En la actualidad, el almacenamiento óptico también está experimentando límites de almacenamiento. Porque si se van a almacenar más datos, las ranuras deben ser más pequeñas y compactas, y la precisión del láser debe ser mayor. Actualmente, un disco Blu-ray de una sola capa puede almacenar más de 25 GB de información. Si se desarrolla con éxito otro láser ultravioleta, la capacidad de su disco óptico podría alcanzar los 500 GB.

¿Cuáles son las ventajas del almacenamiento de ADN frente al almacenamiento magnético y al almacenamiento óptico?

En primer lugar, ahorra espacio. Pero estos métodos de almacenamiento en mosaico de una sola capa son varios órdenes de magnitud diferentes de la estructura tridimensional de doble hélice del ADN. El cuerpo físico de Dan es muy pequeño, tiene una estructura tridimensional y la densidad de datos por unidad de espacio es muy alta. Por poner un ejemplo sencillo, 1 gramo de ADN es menor que el tamaño de una gota de rocío en la yema del dedo, pero puede almacenar 700TB de datos, lo que equivale a 14.000 discos Blu-ray de 50GB o 233 discos duros de 3TB (casi 151KG). ).

Además, ahorra mucho energía. Los métodos de almacenamiento existentes, como un centro de datos, consumen una gran cantidad de silicio monocristalino y una gran cantidad de electricidad. Los materiales de ADN sólo necesitan almacenarse en un lugar fresco y seco y, básicamente, no requieren mantenimiento manual adicional. Incluso si fuera necesario congelar el ADN, los recursos y la energía consumidos son casi insignificantes.

Además, el punto más importante es que el tiempo de conservación es muy largo. Hoy en día, los recuerdos de alta densidad se deterioran con el tiempo. La herramienta de almacenamiento más larga es la cinta magnética, que tiene una vida útil de 50 años, y otras memorias tienen una vida útil más corta. En comparación, el ADN tiene una vida útil de 100 años. Si se congela, puede almacenarse durante miles o incluso decenas de miles de años.

Parece haber un plan para salvar la civilización humana, pero ¿cómo se almacena el ADN?

Como todos sabemos, el ADN está compuesto de cuatro bases nitrogenadas: A, T, C y G. Los científicos dan adenina (A), guanina (G), citosina (C) y timo, respectivamente. (T) valor binario (A y C = 0, G y T = 1), y luego sintetizar la secuencia del gen a través de un chip de microfluidos. De esta manera, estos pares de bases se codifican en una combinación de 1 y 0, y la información de la secuencia del ADN se puede utilizar para expresar lenguaje binario.

Cada vez que se escribe un lenguaje binario en una secuencia de ADN, el "disco duro de ADN" se puede almacenar en un entorno de baja temperatura.

Cuando necesitamos leer datos, solo necesitamos secuenciar el ADN objetivo, restaurar los pares de bases a códigos binarios y luego completar la decodificación para restaurarlos a nuestros datos comunes.

El principio es muy sencillo, pero ¿cómo lo hacen los científicos? Esta es una breve revisión de la historia de la tecnología de almacenamiento de ADN.

El artista que pensó por primera vez en este método, Joe Davis, colaboró ​​con investigadores de la Universidad de Harvard en 1988 para convertir una fotografía de una matriz de 7*5 píxeles llamada Microvenus en 35 bases. La secuencia de ADN se insertó en E . coli, escribiendo por primera vez en el ADN información que no pertenecía a la evolución natural.

(Microvenus representa a las mujeres y la tierra)

2010 ¿El biólogo sintético estadounidense Craig? Craig Venter dirigió el equipo de investigación para sintetizar químicamente todo el genoma del ADN de Mycoplasma, lo llamó "Synthia" y añadió el nombre del investigador y el nombre del instituto para "divertirse". Los sitios web y los poemas del poeta irlandés James están codificados. en el ADN recién sintetizado.

2011 por los biólogos sintéticos George Church de la Universidad de Harvard, Sriram Kothuri y John? El experto en genómica Gao Yuan de la Universidad Hopkins llevó a cabo el primer experimento de prueba de concepto. El equipo utilizó fragmentos cortos de ADN para codificar un libro de 659 KB con datos de la iglesia.

¿En 2013, Nick del Instituto Europeo de Bioinformática (EBI)? Nick Goldman y su equipo de investigación también incluyeron con éxito los sonetos de Shakespeare y Martin? ¿Lutero? En los fragmentos de ADN se escribieron cinco archivos, incluidos extractos del discurso "Tengo un sueño" de King y copias del documento de doble hélice de ADN de Watson y Crick. Los datos de 739 KB se convirtieron en el archivo de almacenamiento de ADN más grande en ese momento.

En 2016, Microsoft y la Universidad de Washington utilizaron la tecnología de almacenamiento de ADN para almacenar aproximadamente 200 MB de datos, convirtiéndose en un gran avance en la tecnología de almacenamiento de información de ADN.

En julio de 2017, "Nature" publicó Seth de la Facultad de Medicina de Harvard. Shipman colaboró ​​con George Church para estudiar el almacenamiento de ADN en organismos vivos. Pusieron una película en blanco y negro de hace 130 años, "Running Horse", en el ADN de E. coli. Aunque hay un "ADN extraño" en E. coli, no sólo puede sobrevivir normalmente, sino también heredar normalmente. Cada copia es una copia de datos. Además, la película almacenada en el genoma se conservó por completo en cada generación de E. coli.

Sin embargo, debido a la replicación, división y muerte de las células, existe el riesgo de errores de información y los datos futuros están seguros. En la mayoría de los casos, el ADN que almacena información existe en forma de polvo de ADN seco, y la investigación sobre el almacenamiento de células vivas se ha centrado en el almacenamiento de ADN sintético.

Ese mismo año, la Universidad de Columbia y el Centro del Genoma de Nueva York publicaron en la revista Science una estrategia eficiente de almacenamiento de ADN llamada algoritmo "Fuente de ADN". Esta tecnología maximiza el potencial de almacenamiento del ADN y comprime con éxito una gran cantidad de información en las cuatro bases del ADN. Es decir, cada ADN codifica 1,6 bits de datos, almacenando un 60% más de información que antes, acercándose al límite teórico (1,8 bits). ). Este método puede almacenar 215 petabytes de datos en un gramo de ADN, lo que equivale a 220 millones de películas.

En 2018, investigadores del Instituto Tecnológico de Waterford (WIT) de Irlanda desarrollaron un nuevo método de almacenamiento de ADN que puede almacenar 1 ZB de datos en 1 g de ADN de E. coli.

En 2019, el equipo de Church publicó los resultados de otro experimento en la revista Science. Codificaron un libro de aproximadamente 53.400 palabras de Church, "Regeneración: cómo la biología sintética transformará la naturaleza y a usted mismo en el futuro", junto con 11 imágenes y un programa Java en un microarray de ADN de menos de una milmillonésima parte de un gramo. y luego utilizó con éxito la secuenciación de ADN para leer el libro.

El rápido desarrollo de estas investigaciones científicas también significa que la tecnología de síntesis de ADN (escritura de datos) y la tecnología de secuenciación de ADN (lectura de datos) están cada vez más maduras. Pero al mismo tiempo, todavía existen algunos problemas en el proceso de codificación del ADN, como la velocidad y el costo de almacenamiento/lectura, y el almacenamiento de ADN todavía está en camino a la comercialización.

En el laboratorio, parece que el almacenamiento del ADN no es complicado, pero todavía existen algunos problemas en la comercialización.

En primer lugar, el almacenamiento y la lectura son muy lentos. El acceso a los dispositivos de almacenamiento de ADN es lento y requiere mucho tiempo.

A diferencia de las señales electromagnéticas almacenadas en discos, la síntesis de ADN se basa en una serie de reacciones químicas. Se necesitan 1 segundo para escribir 200 MB de datos en el disco y casi 3 semanas para sintetizarlos con ADN.

En segundo lugar, los medios de ADN no se pueden sobrescribir ni reescribir. En el ADN, una vez que se almacena la información, generalmente no se puede modificar. Si desea leer este documento, debe ordenar completamente toda la información antes de transcodificarla.

En tercer lugar, es necesario mejorar la precisión del almacenamiento de datos. Actualmente, las lecturas repetidas en la secuenciación de ADN conllevan una alta probabilidad de errores de lectura.

En cuarto lugar, la dislexia aleatoria. La tecnología actual de síntesis de ADN no puede producir moléculas largas de ADN a la vez, sino que sólo puede sintetizar muchos fragmentos cortos. Esto dificulta la recuperación rápida de datos específicos en una mezcla de muchos fragmentos pequeños de ADN.

Por último, y lo más importante, el coste del almacenamiento del ADN es demasiado elevado. Por ejemplo, almacenar 200 MB de datos en ADN cuesta actualmente 800.000 dólares, mientras que utilizar equipos electrónicos cuesta menos de 1 dólar.

Pero como se mencionó anteriormente, si se coloca en una escala de tiempo más larga, bajo la presión del espacio de almacenamiento de datos, las ventajas únicas del ADN, como la alta densidad de almacenamiento, el alto ahorro de energía y la protección del medio ambiente, y una larga estabilidad, serán manifiestas. . Mientras se mejore la eficiencia de la codificación y secuenciación del ADN y se reduzca considerablemente el costo con el desarrollo de la tecnología de almacenamiento y lectura, el almacenamiento de ADN no estará lejos de su aplicación comercial.

Entonces, ¿cuál es el progreso en la comercialización ahora?

En 2015, Microsoft y la Universidad de Washington publicaron conjuntamente un resultado que utilizaba información de lectura de punto fijo, es decir, añadiendo algunas etiquetas de seguimiento a una cadena de ADN muy larga. Estos marcadores son similares a un mecanismo de indexación y se pueden leer seleccionando los marcadores apropiados sin tener que esperar a que se secuencia toda la cadena larga de ADN cada vez.

En 2018, China Literature logró otro avance en tecnología. Microsoft ha desarrollado una tecnología de lectura de "nanoporos" que permite que una columna de medios de ADN pase a través de un pequeño nanoporo para leer cada base de ADN. Esta tecnología reduce en gran medida el gasto de espacio de los dispositivos de lectura. Un dispositivo USB del tamaño de la palma de la mano puede leer, pero la velocidad de lectura es de unos pocos KB por segundo, lo que sigue siendo bastante lento.

2065438+En marzo de 2009, el equipo de Microsoft publicó un nuevo desarrollo en la revista "Nature". Desarrollaron el primer medio de almacenamiento automático de ADN del mundo. En comparación con la síntesis y secuenciación artificial de ADN, poder codificar y decodificar automáticamente el ADN es la salida para una futura comercialización.

Además, Catalog, una nueva empresa estadounidense fundada en 2016, también está tratando de resolver los problemas de duración y costo del almacenamiento y la lectura del ADN.

El año pasado, Catalog almacenó una versión en inglés ***16G de Wikipedia sobre una molécula de ADN. Utilizaron un dispositivo de escritura de ADN para registrar estos datos en ADN a 4 Mbps. Esto significa que puedes grabar 125 GB en un día, lo que equivale aproximadamente a la capacidad de almacenamiento de un teléfono móvil de alta gama. Esta velocidad ya triplica la velocidad de almacenamiento estudiada anteriormente.

Actualmente, Catalog utiliza cadenas de ADN sintético prefabricadas de 20 a 30 pares de bases de longitud, lo que permite almacenar más datos anidando enzimas. La disposición de estos fragmentos es similar al uso de las 26 letras en inglés y, en teoría, se pueden producir innumerables combinaciones. Según las estimaciones de Catalog, el coste futuro de almacenar 1 MB de datos de ADN será inferior a 0,001 céntimos.

Por supuesto, si esta startup realmente puede reducir los costos significativamente en el futuro, podría allanar el camino para la comercialización del almacenamiento de datos de ADN.

En 2019, la tecnología de almacenamiento de datos de ADN estuvo entre las diez principales tecnologías emergentes del mundo publicadas conjuntamente por Scientific American y el Foro Económico Mundial.

Es previsible que el almacenamiento magnético y el almacenamiento óptico sigan ocupando la corriente principal del almacenamiento de datos en el futuro. Sin embargo, incluso sin la situación extrema del fin de la tierra, los seres humanos todavía se enfrentan al grave problema de la falta de espacio de almacenamiento de datos debido al aumento de datos en los últimos años. Al mismo tiempo, el aumento de la demanda de almacenamiento de datos ha provocado un aumento en el uso de obleas de silicio y los consiguientes problemas de contaminación ambiental y consumo de agua y energía.

La implementación de la tecnología de almacenamiento de ADN aliviará hasta cierto punto el problema de capacidad del almacenamiento tradicional y reducirá en gran medida el consumo de componentes electrónicos y energía.