A redundância de dados pode causar anomalias de dados em um banco de dados - mais comumente erros de inserção, exclusão e atualização. O processo de normalização de dados ajuda a eliminar a redundância de dados e as anomalias resultantes.
A redundância de dados ocorre quando um dado específico pode ser encontrado em mais de uma área do banco de dados. Um exemplo comum seria o banco de dados de uma universidade ou faculdade de matrículas atuais em cursos. Um aluno pode estar matriculado em vários cursos diferentes, portanto, seu registro individual de aluno pode ser reproduzido várias vezes. Em um cenário de manufatura, um único fornecedor pode ser usado para vários projetos e produtos.
É importante eliminar a ocorrência de redundância de dados e, ao mesmo tempo, manter a integridade dos dados por meio do processo de normalização em várias etapas. A redundância normalmente resulta em três anomalias de dados comuns - ou instâncias em que os dados são inconsistentes.
- Anomalia de inserção - em que os dados não podem ser armazenados ou atualizados, a menos que outro dado seja armazenado ao mesmo tempo. No exemplo dos registros do aluno, isso pode ocorrer se não for possível inserir um registro do aluno até que ele tenha se matriculado em um curso.
- Atualizar anomalia - onde uma das cópias de um registro é atualizada e a outra não; todas as cópias devem ser atualizadas simultaneamente.
- Anomalia de exclusão - ocorre quando a exclusão de um dado significa que outras informações também são perdidas. Nos exemplos dos alunos, isso pode ocorrer se a exclusão de um curso significar também a exclusão dos registros do aluno relacionados.