Distribuição de Frequência
Uma distribuição de frequência é uma série estatística na qual os dados estão organizados em grupos de classes ou categorias estabelecidas convenientemente.
As distribuições de frequência podem ser divididas em dois tipos:
- Distribuição de frequência sem intervalos de classe, ou distribuição pontual, onde todos os valores dos dados coletados são apresentados, e não há perdas de valores ou,
- Distribuição de frequência com intervalos de classe, onde os valores estão representados por faixas de magnitude.
Para o exemplo apresentado, valores diários de produção de leite de vinte vacas holandesas, a distribuição de frequência sem intervalos de classes, ou pontual, é:
Tabela 1 – Distribuição de frequência pontual para a produção de leite.
ProduÇÃo de leite (kg.dia-¹) | FrequÊncia absoluta (fi) |
17.0 | 1 |
17.5 | 2 |
18.0 | 1 |
18.2 | 2 |
18.5 | 2 |
18.9 | 4 |
20.9 | 3 |
23.5 | 2 |
24.6 | 1 |
24.7 | 1 |
25.5 | 1 |
Total | 20 |
Observe que na tabela todos os valores de dados obtidos estão apresentados e, portanto, não há perda de informação.
Frequ�ncia absoluta (Fi)
Definimos como frequência absoluta (fi) o número de vezes que o dado aparece na amostra, ou, no caso de estarmos apresentando uma distribuição de frequência por classes, o número de elementos pertencentes a uma classe.
Tabela 2 - Distribuição de frequência com intervalos de classe para a produção de leite.
ProduÇÃo de leite (kg.dia-¹) | FrequÊncia absoluta (fi) |
17,0 ├ 18,7 | 8 |
18,7 ├ 20,4 | 4 |
20,4 ├ 22,1 | 3 |
22,1 ├ 23,8 | 2 |
23,8 ├ 25,5 | 3 |
Total | 20 |
A soma das frequências absolutas é igual ao número total de dados:
Limites de classe
Na Tabela 2 aparece uma notação (├) que é utilizada para identificar os limites da classe e significa que estão incluídos os valores mínimos e excluídos os valores máximos, ou seja, na classe 18,7 ├ 20,4 estão computados os valores de 18,7 (inclusive) a 20,4 (exclusive). Esta é a notação que deve ser utilizada para identificar os limites de classe, de acordo com a Resolução 866/66 do IBGE, ou seja, desta quantidade até menos aquela.
Outras notações:
18,7 ┤20,4 – excluído o valor correspondente ao limite inferior e incluído o valor correspondente ao limite superior.
18,7 │─│20,4 – incluídos os valores entre 18,7 e 20,4 (excluídos os valores 18,7 e 20,4).
O menor número é o limite inferior da classe (li) e o maior número, o limite superiorda classe (Li).
N�mero de Intervalos de Classe (k)
Para definirmos o número de classes em que os dados serão divididos, podemos utilizar as seguintes fórmulas, sendo n= tamanho da amostra:
F�rmula de Sturges:
Em nosso exemplo, da Tabela 2:
a) n= 20 à k = 5
b) k = 1 + 3,32 log (20); k = 5,29 arredondando k = 5,0.
Na montagem de uma tabela de distribuição de frequência não há uma fórmula exata para o número de intervalos de classes. As que apresentamos acima são para encontrarmos um primeiro valor. Via de regra, devemos usar no mínimo 5 e no máximo 15 classes. Menos de cinco classes perdemos muita informação e, mais do que 15 classes, a tabela fica muito extensa, dificultando a interpretação dos dados.
Amplitude do intervalo de classe (h)
Calculamos a amplitude de cada classe dividindo a amplitude total pelo número de classes (k). Assim, para o exemplo, temos amplitude total de 8,5 e k=5, logo,a amplitude de cada intervalo de classe será 1,7 (8,5 / 5 = 1,7).
Geralmente, mas não obrigatoriamente, iniciamos a primeira classe pelo menor valor do conjunto de dados, somando o valor da amplitude de classe para encontrar o limite superior, e assim sucessivamente, até a última classe que poderá, ou não, ter o maior valor da variável em estudo como o limite superior da classe.
Em uma tabela de distribuição de frequência com intervalos de classe ganhamos simplicidade, mas perdemos informação. No exemplo da Tabela 2 podemos observar que 8 vacas produziram entre 17,0 e 18,7 kg de leite por dia, mas não sabemos exatamente quanto cada uma produziu.
Frequ�ncia relativa (fri):
A frequência relativa é dada pela razão entre a frequência absoluta de cada classe e a frequência total ou soma das frequências absolutas:
A utilização da frequência relativa facilita as comparações entre mais de um conjunto de dados com diferentes números de elementos.
A soma das frequências relativas é sempre igual a 1.
Na Tabela 3 pode ser observada a frequência relativa de cada classe para o exemplo dado anteriormente.
Frequ�ncia acumulada (F):
A frequência acumulada é a soma da frequência absoluta da classe em questão com as frequências absolutas das classes anteriores, sendo a frequência acumulada da última classe igual ao número total de observações.
A Tabela 3 apresenta uma distribuição de frequência, onde podem ser visualizados todos os tipos de frequência.
Tabela 3 - Distribuição de frequência em classes para a variável produção de leite.
Classe (i) | ProduÇÃo de leite (kg.dia-¹) | fi | xi | fri | Fi | Fri | fpi | Fpi |
1 | 17,0 I--- 18,7 | 8 | 17,85 | 0,40 | 8 | 0,40 | 40,0 | 40,0 |
2 | 18,7 I--- 20,4 | 4 | 19,55 | 0,20 | 12 | 0,60 | 20,0 | 60,0 |
3 | 20,4 I--- 22,1 | 3 | 21,25 | 0,15 | 15 | 0,75 | 15,0 | 75,0 |
4 | 22,1 I--- 23,8 | 2 | 22,95 | 0,10 | 17 | 0,85 | 10,0 | 85,0 |
5 | 23,8 I--- 25,5 | 3 | 24,65 | 0,15 | 20 | 1,0 | 15,0 | 100 |
∑=20 | ∑=1,0 | ∑=100 |
Frequ�ncia acumulada relativa (Fri):
É dada pela frequência acumulada (F) da classe, dividida pela frequência total (∑fi) do conjunto de dados. A frequência acumulada da última classe é igual à unidade.
Frequ�ncia percentual (fpi):
A frequência percentual é obtida pela multiplicação da frequência relativa por cem (100):
Frequência acumulada percentual (Fpi):
A frequência acumulada percentual é obtida pela multiplicação da frequência acumulada relativa por cem (100):
A frequência acumulada percentual da última classe é igual a 100.
Ponto m�dio de uma classe (xi):
O ponto médio de uma classe, como diz o nome, é o ponto que divide o intervalo de classe em duas partes iguais. É dado pela soma dos limites inferior e superior da classe dividido por dois.
Assim, para o exemplo apresentado (Tabela 3), o ponto médio da classe 3 é dado por:
x3= (l3+L3)/2 à x3 = 20,4 + 22,1 / 2 à x3 = 42,5 / 2 à x3 = 21,25.
O ponto médio de uma classe é o valor que a representa.
O conhecimento dos valores referentes aos vários tipos de frequência, como apresentado na Tabela 3, ajuda-nos a responder alguns questionamentos com relativa facilidade, tais como os seguintes:
a) Quantas vacas produzem menos do que 20,4 kg de leite por dia?
Esse valor refere-se ao limite superior da segunda classe e, portanto, a resposta é igual à frequência acumulada da segunda classe (F2): 12 animais ou 60% (Fp2).
b) Quantas vacas produzem mais do que 23,8 kg de leite por dia?
Esse valor é o limite inferior da quinta classe, logo: 3 animais produzem mais do que 23,8 kg de leite diários (f5) ou 15,0% do total (fp5).