As regras de emparelhamento de bases para DNA são governadas pelos pares de bases complementares: adenina (A) com timina (T) em um emparelhamento AT e citosina (C) com guanina (G) em um emparelhamento CG. Por outro lado, a timina se liga apenas à adenina em um emparelhamento TA e a guanina apenas se liga à citosina em um emparelhamento GC.
O ácido desoxirribonucléico, ou DNA, contém todo o conjunto de informações essenciais para a sobrevivência de um organismo. Este conjunto de instruções é codificado em uma estrutura de fita dupla-hélice composta de monômeros de nucleotídeos. Cada nucleotídeo carrega um grupo fosfato, um açúcar de cinco carbonos chamado desoxirribose e uma das quatro nucleobases. As quatro bases contendo nitrogênio encontradas no DNA são A, T, C e G. A e G são classificadas como "purinas", enquanto C e T são consideradas "pirimidinas". As purinas são maiores em tamanho em comparação com as pirimidinas.
Uma descoberta importante sobre a estrutura do DNA foi feita por Edwin Chargaff em 1949. Em um de seus experimentos, Chargaff ilustrou que a quantidade de A é igual à de T, enquanto a quantidade de C é igual à de G . Ele então concluiu que a base complementar de A deve ser T e a base complementar de C deve ser G. As descobertas de Chargaff formaram a base para o princípio de emparelhamento de bases do DNA.