Antes de prosseguirmos, é importante entender do que estamos falando quando nos referimos a uma relação empírica e contrastar isso com estudos teóricos. Alguns resultados estatísticos e outros campos do conhecimento podem ser derivados de algumas declarações anteriores de maneira teórica. Começamos com o que sabemos e depois usamos lógica, matemática e raciocínio dedutivo e veja aonde isso nos leva. O resultado é uma consequência direta de outros fatos conhecidos.
Contrastar com o teórico é a maneira empírica de adquirir conhecimento. Em vez de raciocinar a partir de princípios já estabelecidos, podemos observar o mundo ao nosso redor. A partir dessas observações, podemos formular uma explicação do que vimos. Muita ciência é feita dessa maneira. As experiências nos fornecem dados empíricos. O objetivo passa a ser formular uma explicação que atenda a todos os dados.
Nas estatísticas, existe uma relação entre média, mediana e modo que é baseada empiricamente. Observações de inúmeros conjuntos de dados mostraram que na maioria das vezes a diferença entre a média e o modo é três vezes a diferença entre a média e a mediana. Essa relação na forma de equação é:
Para ver a relação acima com dados do mundo real, vamos dar uma olhada nas populações estaduais dos EUA em 2010. Em milhões, as populações eram: Califórnia - 36,4, Texas - 23,5, Nova York - 19,3, Flórida - 18,1, Illinois - 12,8, Pensilvânia - 12,4, Ohio - 11,5, Michigan - 10,1, Geórgia - 9,4, Carolina do Norte - 8,9, Nova Jersey - 8,7, Virgínia - 7,6, Massachusetts - 6,4, Washington - 6,4, Indiana - 6,3, Arizona - 6,2, Tennessee - 6,0, Missouri - 5.8, Maryland - 5.6, Wisconsin - 5.6, Minnesota - 5.2, Colorado - 4.8, Alabama - 4.6, Carolina do Sul - 4.3, Louisiana - 4.3, Kentucky - 4.2, Oregon - 3.7, Oklahoma - 3.6, Connecticut - 3,5, Iowa - 3,0, Mississippi - 2,9, Arkansas - 2,8, Kansas - 2,8, Utah - 2,6, Nevada - 2,5, Novo México - 2,0, Virgínia Ocidental - 1,8, Nebraska - 1,8, Idaho - 1.5, Maine - 1.3, New Hampshire - 1.3, Havaí - 1.3, Rhode Island - 1.1, Montana - .9, Delaware - .9, Dakota do Sul - .8, Alasca - .7, Dakota do Norte - .6, Vermont -. 6 Wyoming - .5
Por exemplo, se sabemos que temos uma média de 10, um modo de 4, qual é a mediana do nosso conjunto de dados? Como Média - Modo = 3 (Média - Mediana), podemos dizer que 10 - 4 = 3 (10 - Mediana). Por alguma álgebra, vemos que 2 = (10 - mediana) e, portanto, a mediana dos nossos dados é 8.
Como visto acima, o acima não é uma relação exata. Em vez disso, é uma boa regra geral, semelhante à do regra de intervalo, que estabelece uma conexão aproximada entre o desvio padrão e alcance. A média, a mediana e o modo podem não se encaixar exatamente no relacionamento empírico acima, mas há uma boa chance de que ele esteja razoavelmente próximo.