Os cientistas dobraram a densidade de gravação de dados no DNA – mais de 400 mil terabytes em um grama

Ao longo de bilhões de anos de evolução da vida biológica na Terra, um mecanismo de registro foi desenvolvido em organismos vivos para transferir informações genéticas de uma geração para a seguinte. Esta é a formação de fitas de DNA na forma de pares alternados de combinações de quatro bases nitrogenadas: adenina (A), guanina (G), citosina (C) e timina (T). Quatro unidades de codificação são melhores que duas (0 e 1), mas esse não é o limite, disseram os cientistas e sintetizaram mais sete compostos orgânicos.

Fonte da imagem: Depositphotos

Expandir o “alfabeto” para codificar dados no DNA de 4 para 11 caracteres irá pelo menos dobrar a já incrível capacidade de tais métodos de armazenamento de informações. Essa abordagem, aliás, também aumentará a velocidade de registro de dados na sequência de DNA, o que hoje é considerado um sério freio ao trabalho nessa direção. Também é necessário entender que os atuais métodos de sequenciamento de DNA não serão capazes de detectar bases nitrogenadas sintetizadas. Lê-los requer novas ferramentas e reações. Mas esses são todos problemas solucionáveis, dizem pesquisadores da Universidade de Illinois em Urban-Champaign.

Para decifrar o DNA, a fita de DNA passa por um nanoporo em uma proteína especialmente projetada que pode detectar bases nitrogenadas individuais, sejam elas naturais ou sintéticas. Os algoritmos de aprendizado de máquina decodificam as informações armazenadas nele. Sim, a IA é indispensável neste assunto, os processos de codificação e descriptografia são tão complexos. No futuro, à medida que a tecnologia avança, as coisas serão muito mais fáceis.

Hoje, levando em conta o uso de apenas quatro bases nitrogenadas básicas para codificação de dados, até 215 PB de dados podem ser armazenados em um grama de DNA. Onze bases dobrarão essa densidade, e esse não é o limite.

«Tentamos 77 combinações diferentes de 11 bases nitrogenadas e nosso método foi capaz de distinguir perfeitamente cada uma delas, disse Chao Pan, coautor do estudo. “O mecanismo de aprendizado profundo usado em nosso método para identificar vários nucleotídeos é versátil, o que nos permite estender nossa abordagem para muitas outras aplicações.”

avalanche

Postagens recentes

O CEO da Nvidia deixou claro que a empresa não planeja mais investir na OpenAI e na Anthropic.

Até recentemente, acreditava-se que a Nvidia investiria os prometidos US$ 100 bilhões na OpenAI, mas…

33 minutos atrás

A Broadcom espera gerar mais de 100 bilhões de dólares em receita com chips de IA no próximo ano.

A Broadcom pode estar sendo ofuscada pelo boom da IA, mas isso não a impediu…

1 hora atrás

A missão lunar Artemis da NASA tem lançamento previsto para 1º de abril.

Um problema na transferência de hélio no estágio intermediário do foguete SLS, na segunda quinzena…

5 horas atrás

A Huawei iniciou as vendas globais de suas soluções de data center com inteligência artificial.

Em meio ao crescente boom da IA, os compradores estão dispostos a pagar por uma…

9 horas atrás

A Nvidia lançou um driver de correção para resolver problemas de voltagem com a GeForce RTX 5000.

A Nvidia lançou a versão 595.76 do driver de correção, que resolve problemas de voltagem…

9 horas atrás