"O resultado se parece com um pequeno montinho de poeira."[Imagem: EMBL]
Dados para sempre
Que o DNA é um mecanismo eficiente para armazenar dados, os próprios seres vivos o demonstram.
Já existem equipamentos para ler as informações do DNA, e mais
recentemente se demonstrou que pode ser possível ler os dados gravados
em moléculas DNA até de fósseis com milhões de anos.
Isso é muito promissor para o armazenamento de dados de longo prazo,
uma vez que um disco rígido ou um CD não duram mais do que uma década - o
meio de armazenamento digital mais confiável atualmente são as fitas
magnéticas, que prometem durar cerca de um século.
Além disso, moléculas de DNA são extremamente pequenas, o que está de acordo com a tendência constante de miniaturização.
Ou seja, gravar dados em DNA parece ser uma boa ideia na maioria dos
enfoques adotados - será um dado apenas para leitura, mas a intenção não
é substituir as memórias de computador, mas criar um meio de armazenar
os dados digitais a longo prazo.
Algoritmo genético
O problema é que ainda não havia uma forma de gravar dados de forma confiável em moléculas de DNA.
Há dois problemas na hora de passar os dados para as moléculas de
DNA. O primeiro é que atualmente só se consegue fabricar moléculas de
DNA em fitas muito curtas. O segundo é que a escrita sai cheia de erros,
particularmente quando é necessário repetir a mesma letra.
Entram então na história Nick Goldman e Ewan Birney, do Laboratório
Europeu de Biologia Molecular (EMBL), que idealizaram um algoritmo de
gravação dos dados no momento da sintetização do DNA que evita os erros.
"Nós sabíamos que precisávamos fazer um código usando apenas fitas
curtas de DNA, e fazer isso de forma a criar uma repetição da mesma
letra seria impossível. Então pensamos, vamos quebrar o código em
porções de fragmentos que se sobreponham, indo nas duas direções,"
explicou Birney.
A técnica consiste em indexar as informações, onde os índices indicam
onde qual fragmento se encaixa na informação total, e garantir que
nenhum fragmento tenha repetições - tão logo surge a necessidade de
gravar uma repetição da mesma letra, passa-se para um novo fragmento e
grava-se essa informação no índice.
A
técnica consiste em indexar as informações, onde os índices indicam
onde qual fragmento se encaixa na informação total, e garantir que
nenhum fragmento tenha repetições. [Imagem: Goldman et al./Nature]
Poeira de dados
Os pesquisadores então pegaram um arquivo MP3 com o discurso "I Have a
Dream", de Martin Luther King, um arquivo JPG contendo a foto do
instituto onde trabalham, um PDF do artigo de Watson e Crick que relatou
a descoberta da estrutura do DNA e um arquivo TXT contendo todos os
sonetos de Shakespeare - tudo foi enviado por email para a empresa
Agilent Technologies, que disponibilizou seus serviços para sintetizar
as moléculas de DNA seguindo o algoritmo de Goldman e Birney.
"Nós baixamos os arquivos e os usamos para sintetizar centenas de
milhares de pedaços de DNA - o resultado se parece com um pequeno
montinho de poeira," disse Emily Leproust, da Agilent, que também figura
como coautora do artigo científico que descreve o experimento.
Ao pegar seu montinho de poeira de volta, os pesquisadores conseguiram ler todas as informações gravadas com 100% de precisão.
Desafios
Há muitos desafios a serem vencidos antes que o armazenamento de
dados em moléculas de DNA possa se tornar prático para uso diário.
Tanto a gravação quanto a leitura são processos lentos e caros, que
ainda precisam de aperfeiçoamento e, sobretudo, automatização.
Mas a demonstração, ao lado de vários outros experimentos similares
realizados ao longo dos últimos anos, mostra que pode ser possível
armazenar todas as águas do "dilúvio de dados" de forma duradoura e que
não exija qualquer tipo de manutenção.
Bibliografia:
Towards practical, high-capacity, low-maintenance information storage in synthesized DNA
Nick Goldman, Paul Bertone, Siyuan Chen, Christophe Dessimoz, Emily M. LeProust, Botond Sipos, Ewan Birney
Nature Physics
Vol.: Published online
DOI: 10.1038/nature11875
Towards practical, high-capacity, low-maintenance information storage in synthesized DNA
Nick Goldman, Paul Bertone, Siyuan Chen, Christophe Dessimoz, Emily M. LeProust, Botond Sipos, Ewan Birney
Nature Physics
Vol.: Published online
DOI: 10.1038/nature11875
Nenhum comentário:
Postar um comentário