De acordo com o Unite for Sight, os cientistas organizam os dados de pesquisa por meio de um processo de codificação e nomenclatura. Os pesquisadores costumam usar software estatístico ou programas de banco de dados para armazenar dados e criar arquivos. Os cientistas devem organizar os dados antes do início da análise de dados.
Os cientistas pegam dados brutos de um experimento, observação ou outro método de pesquisa e atribuem cada informação como uma variável. De acordo com a Universidade da Califórnia em Riverside, a maneira como um cientista codifica uma variável depende do tipo de variável. Uma variável binária recebe um código zero ou um, enquanto as variáveis contínuas recebem um número de código até as possibilidades de opções do estudo. O tipo de variável informa o teste estatístico que o cientista usa. Mesmo alguns estudos qualitativos usam a codificação para organizar os dados em categorias. No software estatístico, cada variável recebe um nome exclusivo para facilitar aos cientistas a execução de testes estatísticos ou a localização de dados para uma resposta específica.
De acordo com o Research Data Management da Boston University, os dados de cada estudo precisam de um nome de arquivo para uma organização posterior. Os cientistas inserem dados e começam a organização em um programa de computador assim que capturam a primeira parte dos dados. O desenvolvimento de uma folha de código padrão melhora a consistência da organização de dados.