O reforço estimula o comportamento, enquanto a punição o desencoraja. Ambos desenvolvem o aprendizado por meio do que é chamado de condicionamento operante, no qual os comportamentos aumentam ou diminuem com base no tipo de resultado obtido.
Edward Thorndike foi um psicólogo que primeiro estudou o condicionamento operante, que descreve o aprendizado baseado nas consequências do aluno. Seu trabalho influenciou o de B.F. Skinner, um psicólogo comportamental que desenvolveu os termos reforço e punição em termos de condicionamento operante. O trabalho de Skinner mostrou que as punições tendem a diminuir a probabilidade de comportamentos específicos, enquanto os reforços tendem a aumentar a probabilidade de comportamentos específicos.
Ambos os termos podem ser descritos em termos positivos e negativos. O reforço positivo oferece algo desejável para aumentar os comportamentos positivos, enquanto o reforço negativo remove algo indesejável para aumentar os comportamentos positivos. A punição positiva oferece algo indesejável para reduzir os comportamentos negativos, enquanto a punição negativa remove algo desejável para reduzir os comportamentos negativos.