O DNA armazena informações em uma sequência de adenina, citosina, guanina e timina em uma estrutura de duas moléculas de desoxirribose, que se entrelaçam em uma dupla hélice. Na natureza, essas informações são lidas por moléculas de RNA e transformadas em proteínas.
É possível codificar dados digitais usados por humanos em DNA sintético e lê-los de volta. Como as quatro bases desse DNA sintético são mapeadas diretamente para sequências de bits usadas por humanos, esse é um processo relativamente simples.
No entanto, em um organismo vivo complexo, ler as informações no DNA é muito mais complicado. O DNA é lido pelo RNA mensageiro, ou mRNA, que é usado pela tradução do RNA, ou tRNA, para criar os aminoácidos e proteínas dos quais a vida depende. Esse processo é amplamente compreendido, e as sequências de DNA responsáveis pelos aminoácidos também são conhecidas. No entanto, a parte do DNA que é usada para criar o RNA e, em última análise, as proteínas depende do que a célula é e de suas condições ambientais imediatas. Determinar o resultado físico dessas proteínas, como a criação e o desenvolvimento de órgãos, requer análises e observações complexas. Consequentemente, traduzir o código genético bruto na forma física e nos atributos de um organismo sem realmente criar o organismo em questão é extremamente difícil.