In questo post vi parlo di una cosa che sembra fantascientifica e forse non sapete, ma sulla quale stanno lavorando in molti: la conservazione dei dati usando il DNA!
Sì, sembra incredibile ma entro il 2024 numerose aziende inizieranno a sperimentare l’uso del DNA per l’archiviazione dei dati per rispondere alla crescita esponenziale della produzione degli stessi, stravolgendo quindi le tecnologie tradizionali di archiviazione che tutti conosciamo.
Sempre più spesso, infatti, la sfida non consiste tanto nella raccolta dei dati quanto nella loro archiviazione a lungo termine e in modo sufficientemente sicuro. Al momento infatti, la maggior parte dei dati può essere archiviata per un massimo di circa 30 anni.
Partiamo da un dato: gran parte delle attività che conduciamo sono diventate digitali e la quantità di dati che si genera, si memorizza e a cui si accede è aumentata in modo esponenziale.
Ad esempio, Google elabora qualcosa come 3,5 miliardi di ricerche ogni giorno mentre su YouTube vengono visti 4,4 milioni di video. Ogni giorno vengono invece caricate su Facebook oltre 350 milioni di foto. Nell’arco di un solo lustro verranno creati quotidianamente a livello mondiale oltre 450 Exabyte di dati.
Questo fa riflettere, perché il volume di dati aumenterà ancora molto visto che circa il 40% della popolazione mondiale non è ancora connesso alla rete.
Come funziona?
La tecnologia della memorizzazione dei dati nel DNA consiste nell’utilizzo di dati digitali binari da inserire nella doppia elica, prendendo la codifica binaria e trasformandola in codifica adatta al filamento di DNA. In pratica le sequenze di 1 e 0 vengono codificate secondo le 4 basi (A-T-C-G) che compongono il DNA.
Questo significa che un anno di conoscenza umana potrebbe essere immagazzinato in un grammo di DNA sintetico per migliaia di anni. In effetti, tutta la conoscenza umana potrebbe essere immagazzinata in una piccola quantità di DNA sintetico.
Non solo nel DNA sarà possibile salvare ed archiviare una grande mole e quantità di informazioni (un grammo può ospitare un trilione di gigabyte), ma c’è anche un altro aspetto positivo da tenere in considerazione: l’archiviazione dei dati può avere vita lunga e raggiungere i 2000 anni senza che i dati si deteriorino (almeno secondo quanto riporta l’American Chemical Society).
Ma quanti dati si possono davvero archiviare sui geni? Secondo gli scienziati di Harvard, circa 700 terabytes per ogni grammo di DNA. La CEO di Twist Bioscience Emily Leproust, “è possibile salvare tutta la conoscenza dell’umanità nel bagagliaio di una macchina“.
Al momento siamo ancora al livello di sperimentazione di laboratorio perché la parte difficile è proprio quella relativa alla codifica e decodifica dei dati. I molti passaggi per la registrazione dei dati e per il loro recupero richiedono del lavoro manuale in laboratorio che si aggiunge a quello di sofisticate macchine come sintetizzatori e sequenziatori.
Affinché tecniche del genere possano avere un senso come soluzioni di storage commerciale, le complessità e i relativi costi devono essere assolutamente ridotti e ciò può essere fatto solo tramite la totale automatizzazione dell’intero processo ed è quello che i ricercatori stanno tentando di ottenere.
L’obiettivo finale, come spiega Karin Strauss, professoressa di Ingegneria Informatica della UW e ricercatrice senior presso Microsoft, “è mettere in produzione un sistema che, per l’utente finale, assomigli molto a qualsiasi altro servizio di cloud storage: i bit vengono inviati a un data center e archiviati lì e vengono visualizzati solo quando il cliente li desidera. Per fare ciò, avevamo bisogno di dimostrare che ciò è pratico dal punto di vista dell’automazione”.
Incredibile, no?