Os cientistas dobraram a densidade de gravação de dados no DNA – mais de 400 mil terabytes em um grama

Ao longo de bilhões de anos de evolução da vida biológica na Terra, um mecanismo de registro foi desenvolvido em organismos vivos para transferir informações genéticas de uma geração para a seguinte. Esta é a formação de fitas de DNA na forma de pares alternados de combinações de quatro bases nitrogenadas: adenina (A), guanina (G), citosina (C) e timina (T). Quatro unidades de codificação são melhores que duas (0 e 1), mas esse não é o limite, disseram os cientistas e sintetizaram mais sete compostos orgânicos.

Fonte da imagem: Depositphotos

Expandir o “alfabeto” para codificar dados no DNA de 4 para 11 caracteres irá pelo menos dobrar a já incrível capacidade de tais métodos de armazenamento de informações. Essa abordagem, aliás, também aumentará a velocidade de registro de dados na sequência de DNA, o que hoje é considerado um sério freio ao trabalho nessa direção. Também é necessário entender que os atuais métodos de sequenciamento de DNA não serão capazes de detectar bases nitrogenadas sintetizadas. Lê-los requer novas ferramentas e reações. Mas esses são todos problemas solucionáveis, dizem pesquisadores da Universidade de Illinois em Urban-Champaign.

Para decifrar o DNA, a fita de DNA passa por um nanoporo em uma proteína especialmente projetada que pode detectar bases nitrogenadas individuais, sejam elas naturais ou sintéticas. Os algoritmos de aprendizado de máquina decodificam as informações armazenadas nele. Sim, a IA é indispensável neste assunto, os processos de codificação e descriptografia são tão complexos. No futuro, à medida que a tecnologia avança, as coisas serão muito mais fáceis.

Hoje, levando em conta o uso de apenas quatro bases nitrogenadas básicas para codificação de dados, até 215 PB de dados podem ser armazenados em um grama de DNA. Onze bases dobrarão essa densidade, e esse não é o limite.

«Tentamos 77 combinações diferentes de 11 bases nitrogenadas e nosso método foi capaz de distinguir perfeitamente cada uma delas, disse Chao Pan, coautor do estudo. “O mecanismo de aprendizado profundo usado em nosso método para identificar vários nucleotídeos é versátil, o que nos permite estender nossa abordagem para muitas outras aplicações.”

avalanche

Postagens recentes

O Google vinculou o reCAPTCHA aos Serviços do Google Play, interrompendo a verificação para usuários do Android que não possuem os serviços do Google.

O Google integrou o sistema de verificação reCAPTCHA de última geração à plataforma fechada Google…

3 horas atrás

A Samsung expande sua equipe de robótica humanoide e acelera a transformação da IA.

A Samsung Electronics expandiu sua equipe de robótica do futuro e, simultaneamente, sua divisão de…

3 horas atrás

A Nvidia gastou mais de 40 bilhões de dólares na aquisição de ativos de outras empresas este ano.

Com receitas recordes em meio ao boom da IA, a Nvidia tem investido muito mais…

8 horas atrás

Foram revelados detalhes sobre os próximos processadores da Intel: Nova Lake, Razor Lake, Titan Lake e Moon Lake, que serão lançados antes de 2028.

A Intel planeja apresentar seus processadores Nova Lake no segundo semestre deste ano. Embora muito…

8 horas atrás

Sob a liderança de Lip-Bu Tan, a Intel nunca conseguiu se livrar de seus problemas centrais.

O impressionante desempenho das ações da Intel este ano pode dar a impressão de que…

14 horas atrás