CONHECIMENTOS DE ESTATISTICA IMPORTANTES PARA O PROFESSOR DE EDUCAÇAO FISICA

CAPÍTULO 1 :  Dados – variáveis - Amostra

1.1 Introdução

Considere as seguintes notícias de jornais e revistas :

  • Segundo dados da Bolsa paulista, os estrangeiros representam 18,4 % dos US$ 8 bilhões que foram movimentados pelo mercado acionário em janeiro. (Folha de S.Paulo, 15 dez.1999)
  • Somente no mês passado, o IBOVESPA, o principal índice da bolsa paulista, teve uma valorização de 17,76 %, saltando de 11.762 pontos para 13.778 pontos.
  • O Instituto Nacional de estudos e Pesquisas Educacionais fez um levantamento com 429.775 jovens que terminaram o 2º grau no ano passado e descobriu que apenas 31,5 % deles pretendem fazer o curso superior. Hoje somente 11 % dos brasileiros entre 18 e 24 anos fazem faculdade.  (Veja, 6 maio 1998).

Diariamente, somos expostos a uma grande quantidade de informações numéricas, semelhantes às relatadas. Assim, necessitamos de conhecimentos e capacitações para compreender informações numéricas produzidas por outros, bem como nos habilitarmos a construí-las. Os procedimentos, técnicos e métodos estatísticos são fundamentais para auxílio à execução dessas tarefas Sinteticamente, estatística é a ciência dos dados.

1.2 Estatística Descritiva
           
A maioria das informações estatísticas nos jornais, relatórios e outras publicações consiste de dados reunidos e apresentados de forma clara para que o leitor possa entender. Tais sumários que podem ser tabulare ou numéricos, são conhecidos como estatística descritiva

1.3 Definição de Estatística
           
            É extremamente difícil definir estatística, e tendo em vista que o seu domínios é muito amplo, o número de definições que encontramos é extremamente grande.
            Uma definição de dicionário afirma que estatística são fatos numéricos coletados sistematicamente, ordenados e estudados.

1.4 Tipos de Dados

            Os dados vêm em diferentes formas, cada uma das quais é tratada de maneira um pouco diferente na conversão em informações.

Classificação dos dados :

a) Qualitativos : Referem-se às observações não numéricas e são classificadas em nominais e ordinais.

Dados Nominais: São dados que podem ser separados em categorias chamadas de não mensuráveis, por exemplo, a cor dos olhos, tipo de acomodação, marcas de carro, as cores dos sapatos calçados por 10 alunos em uma palestra, e assim por diante.


Dados Ordinais : Esses dados são equivalentes aos nominais, porém incluindo uma ordem , uma hierarquia. Por exemplo, o cargo dos funcionários registrado no cadastro da empresa : presidente, diretor, gerente etc, a resposta de um questionário de pesquisa onde há uma escala para escolher: bom, regular, ruim.


b) Quantitativos : São dados que são medidos, contados ou quantificados de alguma maneira. Podem ser de dois tipos : discretos e contínuos.

Dados Discretos : São dados que referem-se aos valores numéricos que assumem somente números inteiros positivos, por exemplo, quantidade de vendas diárias de uma empresa; número de filhos de uma família; número de jóias usadas por 10 alunos, número de acidentes nas estradas durante o carnaval, etc.

Dados Contínuos : São dados numéricos que assumem qualquer valor dentro de um intervalo contínuo.

1.5 Variável

            È uma característica de interesse para os elementos. Considere a seguinte tabela

Conjunto de dados contendo informações financeiras referentes a 5 empresas


Empresa
Bolsa de Valores
Símbolo  do Painel eletrônico
Vendas anuais (US$ milhões)
Preço da ação (US$)
Relação preço/ganho
Award Software
OTC
AWRD
15,7
11,500
22,5
Hudson General
AMEX
HGC
30,2
39,750
11,2
ICU Medical
OTC
ICUI
26,5
8,500
15,7
Hot Topic
NYSE
HOTT
48,3
15,750
27,2
OrCad
OTC
OCAD
21,9
11,375
18,3

            Na tabela acima temos cinco variáves : Bolsa de Valores, Símbolo do painel eletrônico, Vendas anuais, preço da ação e relação preço/ganho.

1.6 População e Amostra

            Em muitas situações, há procura de dados  para um grande número de elementos (indivíduos, empresas, eleitores, famílias, produtos, clientes, etc.) Devido ao tempo, ao custo e a outros fatores, os dados são coletados a partir d uma pequena porção do grupo. O grupo maior de elementos em um determinado estudo é chamado de população, e o grupo menor é chamado de amostra
Formalmente, usaremos as seguintes definições:

População é o conjunto de todos os elementos de interesse em um determinado estudo

Amostra é um subconjunto da população.


Exercícios :

1- Declare se cada uma das seguintes variáveis é qualitativa ou  quantitativa ?
            a) Idade
            b) Gênero
            c) Classe social
            d) Marca de Automóvel
            e) Número de pessoas que são favoráveis à pena de morte.


2-Declare se cada uma das seguintes variáveis é qualitativa ou quantitativa :
            a) Vendas anuais
            b) Tamanho dos refrigerantes (pequeno, médio, grande)
            c) Classificação dos empregados (GS1 até GS18)
            d) Ganhos por ação
            e) Método de pagamento (à vista, com cheque, com cartão de crédito)

3-Um levantamento de um jornal argüiu 2.013 adultos: “Você está satisfeito com a situação da economia do Brasil hoje ?”. As categorias das respostas eram insatisfeito, satisfeito e indeciso
            a) Qual foi o tamanho da amostra para essa pesquisa ?
b) Os dados coletados eram qualitativos ou quantitativos ?
c) Para um resumo dos dados para esta questão, faria mais sentido usar as médias ou as porcentagem ?
d) Dos que responderam, 28 % disseram que estavam insatisfeitos com a situação da economia do Brasil. Quantos indivíduos forneceram esta resposta ?

4-O seguinte conjunto de dados fornece um quadro do desempenho financeiro de uma determinada empresa – dezembro/2010


2006
2007
2008
2009
Ganho por ação
$2,78
$2,13
$3,41
$3,83
Renda(milhões)
$11,87
$12,57
$13,43
$14,92
Renda líquida(milhões)
$1,51
$1,17
$1,89
$2,12
Valor Nominal por ação
$14,35
$10,98
$12,67
$13,98

a)    Quantas variáveis existem na tabela ?
b)    Os dados são qualitativos ou quantitativos ?


5-Classifique as variáveis em qualitativas ou quantitativas (continuas ou discretas):

a)    População : alunos de uma escola
Variável : cor dos cabelos -...

b)    População : Casais residentes em uma cidade
Variável : número de filhos - ...

c)    População : as jogadas de um dado
Variável : o ponto obtido em cada jogada - ...

d)    População : peças produzidas por certa máquina
Variável : número de peças produzidas por hora - ...

e)    População : peças produzidas por certa máquina.
Variável : diâmetro externo - ...




CAPÍTULO 2 – Séries Estatísticas

  1. Tabelas

Tabela é um quadro que resume um conjunto de observações.
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. E isto ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo

Uma tabela compõe-se de :

Um corpo : conjunto de linhas e colunas que contém informações sobre a variável em estudo.
Um cabeçalho : parte superior da tabela que especifica o conteúdo das colunas.

Uma coluna indicadora : parte da tabela que especifica o conteúdo das linhas.

Linhas : são as retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com a coluna.

Um título : conjunto de informações, as mais completas possíveis, respondendo às perguntas : O QUÊ ? QUANDO? ONDE ?, e localizado no topo da tabela.
                       
                           Matrículas – Fafipa – 2007/2011
       
Anos
Matrículas
2007
1.680
2008
1.760
2009
1.938
2010
1.850
2011
1,780

2. Séries Estatísticas

            Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticos, em função da época, do local ou da espécie.

            Daí, podemos inferir que numa série estatística observamos a existência de três elementos ou fatores : o tempo, o espaço e a espécie.
            Conforme varie um dos elementos da série, podemos classificá-la em histórica, geográfica e específica.

2.1 Série Histórica : Uma série é histórica quando varia o tempo permanecendo fixo o local e a espécie.

Exemplo :                   Matrículas – Fafipa – 2007-2011

Anos
Matrículas
2007
1.680
2008
1.760
2009
1.938
2010
1.850
2011
1,780
2.2 Série Geográfica : Uma série é geográfica quando varia o local permanecendo fixo o tempo e a espécie.

Exemplo :                   Matrículas – Fafipa – 2010
                                           Por municípios
           
Municípios
Matrículas
Paranavaí
680
Cianorte
120
Loanda
185
Nova Esperança
90
Colorado
70
Total
1145
                            Fonte : Secretaria

2.3 Série Específica : Uma série é específica quando varia a espécie permanecendo fixo o local e o tempo.

Exemplo :                    Matrículas – Fafipa – 2006
                                            Por curso
Cursos
Matriculas
Administração
420
C. Contábeis
380
Enfermagem
160
Pedagogia
220
Ed. Física
120
Total
1.300
                                   Fonte : Secretaria.


2.4 Séries conjugadas : Muitas vezes temos necessidade de apresentar, em uma única tabela a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries.

Exemplo :  Estimativa da renda interna segundo os ramos
                   de atividade.


Renda Interna (R$ 1.000.000)
Ramo de Atividade
2009
2009
2010
Agricultura
421.933
708.848
1.446.050
Indústria
1.046.289
1.726.161
3.778.060
Serviços
1.662.867
2.886.801
5.880.469
Total
1.131.089
5.321.810
11.104.579
Fonte : Dados fictícios.




CAPÍTULO 3 – Representação Gráfica

            O gráfico estatístico nada mais é que outra forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries.
            A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais, para ser realmente útil :

            Simplicidade : o gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros.
            Clareza : o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo.

            Veracidade : o gráfico deve expressar a verdade sobre o fenômeno em estudo.

3.1 – Gráficos

Gráfico de Colunas ou de Barras : Este é o tipo mais normalmente utilizado de representação gráfica. Cada categoria é representada por uma barra retangular distinta, sendo a freqüência indicada pelo comprimento/altura da barra.
            Esse gráfico pode ser utilizado para todos os tipos de dados, exceto dados contínuos e dados ordinais na forma de série histórica.

Exemplo :  Produção de Auto-Veículos
                  São Paulo – 2006-2011

Anos
Quantidade (1.000 unid)
 2006
919
2007
1.063
2008
1.128
2009
1.165
2010
781
2011
859
                Fonte: dados hipotéticos.







Gráfico de Setores : Esse gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação de um dado no total.
            O total é representado pelo círculo, que fica dividido, em tantos quanto são as partes.
            Obtemos cada setor por meio de uma regra de três simples e direta.
            De maneira similar a um gráfico de barra/coluna, o gráfico de setores pode ser utilizado para a maioria dos tipos de dados. Entretanto, como um gráfico de setores é utilizado para mostrar  que proporção do todo é tomada por uma categoria, ele somente será útil se o número de categorias for pequeno e cada uma for uma proporção significativa do total de dados.

Exemplo :   Rebanhos – Paraná – 2008
Espécie
Qde ( 1.000 cabeças)
Bovinos
119
Suínos
34
Ouvinos
18
Caprinos
8
Total
179
                  Fonte :
           
Fazer a regra de três para encontrar os graus.
                                                                                 







Gráfico em Linha ou em Curva

            Os gráficos de linhas são bastante utilizados na identificação de tendências de aumento ou diminuição dos valores numéricos de uma dada informação.
            É um gráfico que é normalmente utilizado para um propósito específico, isto é, apresentar dados de uma série temporal.

Exemplo :  Comércio Exterior
                   Brasil – 2000-20109
Anos
Exportação(1.000 t)
2000
45.694
2001
64.059
2002
78.462
2003
92.985
2004
89.689
2005
81.689
2006
87.517
2007
98.010
2008
109.100
2009
123.994








EXERCÍCIOS:

1.Procure em jornais e revistas, e copie exemplos de séries estatísticas, classificando-as.

2.Representar as seguintes tabela usando um gráfico.

2.1 Automóveis nacionais mais                      2.2 Comércio Exterior - Brasil                       
      Vendidos – Jan-Ago – 2000                                    2000-2009
Veículos
Qde vendidas


Anos
Importação(1000 t)
Gol
166.158


2000
38.487
Uno
58.556


2001
49.769
Palio
86.776


2002
54.898
Astra
22.006


2003
53.081
Corsa
66.065


2004
61.652
Vectra
23.162


2005
62.062
Palio Weeken
18.997


2006
69.790
Fiesta
24.586


2007
73.328
Corsa Sedan
55.334


2008
71.855
Parati
18.765


2009
64.064
Fonte: Folha S.Paulo – Ago-2000            Fonte:


2.3 Produção de cebola                                  2.4 Matriculas - Fafipa           
      Brasil – 2008                                      Por cidade - 2007
Estados
Quantidade(t)


Cidades
Alunos
São Paulo
383.430


Paranavaí
580
R.G. do Sul
252.832


Loanda
240
S. Catarina
170.403


Colorado
125
Pernambuco
81.136


N.Esperança
260
M. Gerais
69.034


N.Londrina
150
Paraná
32.854


Primavera
108




Paranacity
105
                                                               Fonte : Dados hipotéticos

2.5 Consumo de Insumo energéticos         2.6 Consumo de borracha na                  
      Indústria de Celulose e Papel – 2007             Indústria – Brasil - 2007

Categoria
Percentagem


Especificação
Consumo (t)
Óleo Combustível
33,3


Borracha vegetal
71.762
Outros derivados
5,8


Borracha regenerada
18.587
Madeira
51,7


Borracha sintética
193.464
Outras alternativas
9,2


Látice vegetal
2.604




Látice Sintético
7.851













CAPÍTULO 4   Sintetizando os Dados quantitativos

            4.1 Distribuição de Freqüência

            Uma distribuição de freqüência é um sumário tabular de dados  que mostra a freqüência (ou o número de observações em cada uma das diversas classes não sobrepostas.
            Vamos considerar neste capítulo, em particular, a forma pela qual podemos descrever os dados estatísticos resultantes de variáveis quantitativas, como é o caso das notas obtidas pelos alunos de uma classe, as estaturas de um conjunto de alunos, os salários recebidos pelos operários de uma fábrica, etc.

            Suponhamos termos feito uma coleta de dados relativos às estaturas de 40 alunos

166
160
161
150
162
160
165
167
164
160
162
161
168
163
156
173
160
155
164
168
155
152
163
160
155
155
169
151
170
164
154
161
156
172
153
157
156
158
158
161
           
A esse tipo de tabela, cujos elementos não foram numericamente ordenados, denominamos tabela primitiva.
A partir dos dados acima, é difícil averiguar em torno de que valor tendem a concentra-se as estaturas, qual a menor ou qual a maior estatura ou ainda, quantos alunos se acham abaixo ou acima de uma dada estatura.
Assim, conhecidos os valores de uma variável formaremos uma idéia exata do comportamento do grupo como um todo, a partir dos dados ordenados.
A maneira mais simples de organizar os dados é através de uma certa ordenação (crescente ou decrescente). A tabela obtida após a ordenação dos dados denominamos rol

150
154
156
157
160
161
162
164
166
169
151
155
156
158
160
161
162
164
167
170
152
155
156
158
160
161
163
164
168
172
153
155
156
160
160
161
163
165
168
173

Já, agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior estatura (178 cm), que a amplitude de variação foi de 173-150 = 23 cm) e, ainda, a ordem que um valor particular da variável ocupa no conjunto. Com um exame mais acurado, vemos que há uma concentração das estaturas em algum valor entre 160 cm e 165 cm e mais ainda que há poucos valores abaixo de 155 cm e acima de 170 cm.

Vamos colocar os dados em uma distribuição de freqüência. No exemplo que trabalhamos, a variável em questão, estatura, será observada e estudada mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o número de vezes que aparecem repetidos.
Ao número de alunos que fica relacionado a um determinado valor da variável denominamos freqüência. Obtemos, assim,  uma tabela que recebe o nome de distribuição de freqüência.

Estatura (cm)
Freq.

Estatura (cm)
Freq.

Estatura (cm)
Freq.
150
1

158
2

167
1
151
1

160
5

168
2
152
1

161
4

168
1
153
1

162
2

170
1
154
1

163
2

172
1
155
2

164
3

173
1
156
3

165
1

Total
40
157
1

166
1




O processo dado é, ainda, inconveniente, já que exige muito espaço, mesmo quando o número de valores da variável (n) é de tamanho razoável. Vamos, então, colocar esses dados em uma distribuição de freqüência com intervalo de classe.
Estaturas (cm)
Frequência
150 |---- 154
4
154 |---- 158
9
158 |---- 162
11
162 |---- 166
8
166 |---- 170
5
170 |---- 174
3
Total
40

Ao agruparmos os valores da variável em classe, nos estamos ganhando em simplicidade, porem perdendo em pormenores. Assim, na tabela anterior, podemos verificar, facilmente, que 4 alunos têm estatura 161 cm de altura e que não existe nenhum aluno com 171 cm de estatura. Já na tabela com classes não podemos ver algum  se algum aluno tem a de 159 cm. Porém, sabemos, com segurança, que 11 alunos têm estatura  compreendida entre 158 a 162 cm

4.2. Elementos de uma distribuição de frequência

4.2.1 Classe : São intervalos de variação da variável

Na tabela anterior 154 |--- 158, define a segunda classe. A tabela acima é constituída de 6 classes.

4.2.2 Limites de Classe : São os extremos de cada classe . Ex.  162 |----166 . Os limites são 162 (inferior) e 166 (superior).

4.2.3 Amplitude de um intervalo de classe : ou simplesmente intervalo de classe é a medida do intervalo que define a classe. Vamos indicar intervalo de classe pela letra h

 h = limite superior – limite inferior  Ls – Li  Ex.  166 |----- 170,        h = 170 – 166 = 4

4.2.4 Amplitude total da distribuição (At ) : é a diferença entre o limite superior da última classe(limite superior máximo) e o limite inferior da primeira classe.(limite inferior máximo).

4.2.5 Amplitude amostral  : é a diferença entre o valor máximo e o valor mínimo da amostra.

                        At = xmax – xmin     

4.2.6 Ponto médio de uma classe :é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais, sendo indicado por xi

                                   Xi =     Li ----- limite inferior                       Ls------- limite superior
 4.3 Número de classes . Intervalos de classe

A primeira preocupação que temos na construção de uma distribuição de freqüência, é a determinação do número de classes e. consequentemente, da amplitude e dos limites dos intervalos de classe.
Para a determinação do número de classes de uma distribuição podemos utilizar a regra de Sturges, que nos dá o número de classe em função do número de valores da variável :

            K = 1 + 3,3  log n                 k---------- número de classes   n------- nº total dos dados

Achado o número de classes que deve ter a distribuição, resta-nos resolver o problema da determinação da amplitude do intervalo de classe, o que conseguimos dividindo a amplitude total pelo número de classes:
                        h =
Se o resultado não for exato, devemos arredondá-lo.

Outro problema que surge é a escolha dos limites dos intervalos, os quais deverão ser tais que forneçam, na medida do possível, para pontos médios, números que facilitem os cálculos – números naturais.

Consideremos, os dados dos 40 alunos da tabela primitiva

Vamos calcular o nº de classes :  k = 1 + 3,3.log(n)         k + 1 +3,3 log (40)                  log(40) = 1,6020

  k = 1 + 3,3 x 1,6020        k  = 1 + 5,28                    k = 6,28 arredondando para número inteiro, k = 6

Vamos agora calcular o intervalo de classe :

  h =    At = 173 – 150      At = 23            então  h =  = 3,8 arredondando para inteiro     h = 4

4.4 Tipos de freqüências

4.4.1 Frequência simples ou absolutas (f) são os valores que realmente representam o número de dados de cada classe.
Como vimos anteriormente, a soma das freqüências simples é igual ao número total dos dados.

                         = n

4.4.2 Frequência relativa (fr) : são os valores das razões entre as freqüências simples e freqüência total.
                         fr =
4.4.3 Frequência acumulada (fa) : é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma dada classe.

4.4.4 Frequência acumulada relativa (fra) de uma classe é a freqüência acumulada da classe, dividida pela freqüência total da distribuição.


EXERCÍCIOS :


1.Considere as notas de 50 alunos:

84
68
33
52
47
73
68
61
73
77
74
71
81
91
65
55
57
35
85
88
59
80
41
50
63
65
76
85
73
60
67
41
78
56
94
35
45
55
64
74
65
94
66
48
39
69
89
98
42
54

Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe.

2.Os resultados do lançamento de um dado 50 vezes, foram os seguintes :

6
5
2
6
4
3
6
2
6
5
1
6
3
3
5
1
3
6
3
4
5
4
3
1
3
5
4
4
2
6
2
2
5
2
5
1
3
6
5
1
5
6
2
4
6
1
5
2
4
3

Forme uma distribuição de freqüência sem intervalo de classe.
3. Idade de 50 funcionários

18
20
20
21
22
24
25
25
26
27
29
29
30
30
31
31
32
33
34
35
36
36
37
37
37
37
38
38
38
40
41
43
44
44
45
45
45
46
47
48
49
50
51
53
54
54
56
58
62
65

Construir uma distribuição de freqüência e calcule todos os elementos da distribuição.

4. A tabela abaixo apresenta as vendas diárias de determinado aparelho elétrico, durante um mês, por uma firma comercial :

14
12
11
13
14
13
12
14
13
14
11
12
12
14
10
13
15
11
15
13
16
17
14
14

Forme uma distribuição de freqüência.

5. Dada a distribuição de freqüência :

xi
3
4
5
6
7
8
f
2
5
12
10
8
3

Determine:
a) As freqüências relativa
b) As freqüências acumuladas
c) As freqüências relativas acumuladas.

6. Complete a tabela abaixo :
Classes
f
fa
fr
fra
 0 |--- 8
4



 8 |--- 16
10



16 |--- 24
14



24 |--- 32
9



32 |--- 40
3



40




6. Complete os dados que faltam na distribuição de freqüência;

xi
f
fa
fr

0
1
    .....
0,05

1
....
4
0,15

2
4
.....
.....

3
....
13
0,25

4
3
....
0,15

5
2
18
.....

6
.....
19
.....

7




20

1,00



Nenhum comentário :

Postar um comentário