Fundamentos de Estatistica.pdf
Fundamentos de Estatistica.pdf
Fundamentos de Estatistica.pdf
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Ciências Sociais<br />
Profa. Cecilia Ap. V. Farhat<br />
<strong>Fundamentos</strong> da<br />
Estatística<br />
1<br />
Objetivos da aula<br />
Fornecer ao aluno elementos básicos para que:<br />
compreenda a Pesquisa Científica e sua<br />
aplicação;<br />
Discutir a abrangência da utilização da<br />
Estatística enquanto instrumento <strong>de</strong> pesquisa e<br />
<strong>de</strong> análise das práticas sociais;<br />
Analisar <strong>de</strong>scritivamente os conceitos<br />
estatísticos mais utilizados nas mensurações<br />
relacionadas a Pesquisas Sociais.<br />
2<br />
Definição <strong>de</strong> estatística<br />
A Estatística é uma ciência que se preocupa<br />
com a organização, <strong>de</strong>scrição, análise e<br />
interpretação dos dados. A sua aplicação se<br />
dá em diversas áreas.<br />
3<br />
1
Dados<br />
São informações numéricas ou fatos,<br />
que po<strong>de</strong>m ser coletadas a partir <strong>de</strong><br />
diversas fontes:<br />
‣ questionário,<br />
‣ ficha médica,<br />
‣ fichas <strong>de</strong> clientes <strong>de</strong> banco,<br />
‣ exames em laboratórios,<br />
‣ etc.<br />
4<br />
Passos da estatística<br />
População:<br />
Uma população é o conjunto <strong>de</strong> todos os<br />
elementos <strong>de</strong> interesse em um<br />
<strong>de</strong>terminado estudo.<br />
Amostra:<br />
Uma amostra é qualquer subconjunto da<br />
população.<br />
5<br />
Passos da estatística<br />
Inferência Estatística:<br />
A inferência estatística procura com base<br />
nas informações numéricas ou dados<br />
obtidos a partir <strong>de</strong> uma amostra para tirar<br />
conclusões sobre dada característica da<br />
população em estudo.<br />
6<br />
2
Quadro resumo<br />
Formular o<br />
Problema.<br />
Desenhar um<br />
Projeto <strong>de</strong><br />
pesquisa<br />
(pensar na<br />
população).<br />
Coletar os dados<br />
(amostra)<br />
Analisar <strong>de</strong>scritivamente<br />
os da -<br />
dos.<br />
Interpretações dos<br />
dados sobre as<br />
características<br />
da população<br />
(relatório).<br />
7<br />
Variáveis<br />
As variáveis são classificadas basicamente<br />
em duas categorias:<br />
1. QUANTITATIVAS:<br />
contínuas e discretas<br />
2 . QUALITATIVAS:<br />
nominal e ordinal<br />
8<br />
Variáveis quantitativas<br />
1.· São as características que são<br />
mensuráveis.<br />
Po<strong>de</strong>m ser:<br />
‣ Variáveis contínuas: quando as<br />
características assumem valores em uma<br />
escala contínua, para as quais valores<br />
fracionais fazem sentido. Usualmente <strong>de</strong>vem<br />
ser medidas através <strong>de</strong> algum instrumento.<br />
Exemplos: peso (balança), altura (régua),<br />
tempo (relógio), pressão arterial, ida<strong>de</strong>, etc.<br />
9<br />
3
Variáveis quantitativas<br />
‣ Variáveis discretas: quando as<br />
características po<strong>de</strong>m assumir valores<br />
inteiros.<br />
Exemplos: número <strong>de</strong> filhos, número <strong>de</strong><br />
bactérias por litro <strong>de</strong> leite, número <strong>de</strong><br />
cigarros fumados ao dia, batimento<br />
cardíaco, etc.<br />
10<br />
Variáveis qualitativas<br />
2. São as características que são <strong>de</strong>finidas<br />
por categorias.<br />
Po<strong>de</strong>m ser:<br />
‣ Variáveis nominais: não existe<br />
or<strong>de</strong>nação <strong>de</strong>ntre as categorias.<br />
Exemplos: gênero, cor dos olhos, hábito <strong>de</strong><br />
fumar, região, etc.<br />
11<br />
Variáveis qualitativas<br />
‣ Variáveis ordinais: existe uma<br />
or<strong>de</strong>nação entre as categorias.<br />
Exemplos: escolarida<strong>de</strong>, estágio da<br />
doença, mês <strong>de</strong> observação, classe<br />
social, etc.<br />
12<br />
4
1.Exemplo: 1,4 milhão <strong>de</strong> menores <strong>de</strong> 14<br />
anos trabalham no Brasil, revela IBGE.<br />
Abaixo algumas variáveis que foram<br />
i<strong>de</strong>ntificadas nesse texto.<br />
Tema da Pesquisa: “Trabalho infantil no<br />
Brasil”<br />
Variáveis quantitativas:<br />
‣ contínuas: ida<strong>de</strong>, remuneração, ...<br />
13<br />
1.Exemplo: 1,4 milhão <strong>de</strong> menores <strong>de</strong> 14<br />
anos trabalham no Brasil, revela IBGE.<br />
Variáveis qualitativas:<br />
‣ Ordinal: faixas <strong>de</strong> ida<strong>de</strong>, faixas salariais<br />
(em salários mínimos),<br />
‣ Nominal: tipos <strong>de</strong> ativida<strong>de</strong>s exercidas<br />
(campo, cida<strong>de</strong>, ...), tipo <strong>de</strong> trabalhos das<br />
pessoas (agrícola e não agrícola), gênero,<br />
inserir no mercado <strong>de</strong> trabalho (queriam,<br />
gostam), ...<br />
14<br />
2. Exemplo<br />
Nome<br />
Nº Carros<br />
Ida<strong>de</strong><br />
Cargo<br />
Sexo<br />
Pes<br />
o<br />
(kg)<br />
Escolarida<strong>de</strong><br />
João<br />
1<br />
27<br />
Supervisor<br />
M<br />
62<br />
E.F.<br />
Alex<br />
2<br />
38<br />
Chefe<br />
M<br />
78<br />
E.M.<br />
Estela<br />
1<br />
34<br />
Gerente<br />
F<br />
65<br />
E.F.<br />
Ana<br />
...<br />
3<br />
32<br />
Secretária<br />
F<br />
58<br />
E.S<br />
15<br />
5
Intervalo<br />
16<br />
Parte I – Análise<br />
Descritiva<br />
17<br />
Análise <strong>de</strong>scritiva<br />
A Estatística Descritiva limita-se a calcular<br />
e ou mostrar o comportamento da variável,<br />
através:<br />
Se as variáveis são quantitativas temos:<br />
Medidas <strong>de</strong> posição,<br />
18<br />
6
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> dispersão,<br />
Tabela <strong>de</strong> frequência,<br />
Gráficos, etc.<br />
Se as variáveis são qualitativas temos:<br />
Tabela <strong>de</strong> contingência,<br />
Gráficos, etc.<br />
19<br />
Parte I.I – Análise Descritiva<br />
para variáveis quantitativas<br />
– Medidas <strong>de</strong> posição.<br />
20<br />
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição<br />
(amostral)<br />
As medidas <strong>de</strong> posição têm a finalida<strong>de</strong><br />
<strong>de</strong> dar informações resumidas sobre os<br />
dados, temos algumas <strong>de</strong>las a seguir:<br />
a) Mínimo,<br />
b) Máximo,<br />
c) Média,<br />
d) Moda,<br />
e) Mediana,<br />
f) etc.<br />
21<br />
7
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição: mínimo e máximo<br />
‣Mínimo (min ou x (1) ) - é a menor<br />
observação do conjunto <strong>de</strong> dados.<br />
Exemplo: Se num conjunto <strong>de</strong> dados temos<br />
5 pessoas com pesos (X) (kg): 50, 40, 45,<br />
50 e 55. O min = 40 kg menor peso.<br />
‣Máximo (max ou x (n) ) - é a maior<br />
observação do conjunto <strong>de</strong> dados.<br />
Exemplo: i<strong>de</strong>m ao anterior. O max = 55 kg<br />
Figura 1<br />
maior peso.<br />
22<br />
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição: média<br />
‣ Média ( x ) - é o elemento central do<br />
conjunto <strong>de</strong> dados e seu cálculo é simples: a<br />
soma dos valores das observações dividida<br />
Figura 2<br />
pelo número <strong>de</strong>las. Assim,<br />
x<br />
x<br />
= + x + 1 2<br />
... + xn<br />
= ∑ xi<br />
lê-se somatória<br />
n<br />
i=<br />
1<br />
<strong>de</strong> x i<br />
n<br />
para i = 1,..., n dividido por n (tamanho da<br />
amostra).<br />
n<br />
23<br />
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição: média<br />
‣ Exemplo (anterior): A média dos dados<br />
será:<br />
‣ x = (50 + 40 + 45 + 50 + 55 ) / 5 = 48<br />
kg – média dos pesos.<br />
‣ (somando todos os valores dos elementos<br />
e dividindo por 5 (n)).<br />
24<br />
8
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição: moda<br />
‣ Moda (mo) - é o valor que ocorre com<br />
maior frequência ou repetição, temos os<br />
casos:<br />
1. Unimodal<br />
2. Bimodal<br />
3. Multimodal<br />
4. Amodal<br />
25<br />
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição: moda<br />
1. Unimodal → quando apenas um<br />
Figura 3<br />
valor ocorre com maior frequência.<br />
Exemplo: Numa sequência <strong>de</strong> pesos:<br />
40, 35, 45, 50, 40 e 55<br />
mo= 40 – unimodal (temos apenas um<br />
valor que se repete mais).<br />
26<br />
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição: moda<br />
2. Bimodal → quando dois valores<br />
ocorrem com a maior freqüência.<br />
Exemplo: Numa sequência <strong>de</strong> pesos: 40,<br />
35, 45, 50, 40, 55 e 45<br />
mo= 40 e 45 - bimodal (temos dois valores<br />
com as maiores frequências).<br />
27<br />
9
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição: moda<br />
3. Multimodal → quando mais <strong>de</strong> dois<br />
valores ocorrem com maior<br />
frequência.<br />
Exemplo: Numa sequência <strong>de</strong> pesos:<br />
40, 35, 45, 50, 40, 50, 45 e 50<br />
mo= 40, 45 e 50 - multimodal (temos<br />
mais <strong>de</strong> dois valores que se repetem<br />
mais).<br />
28<br />
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição: moda<br />
4. Amodal → quando todos os valores<br />
tem mesma freqüência.<br />
Exemplo: Numa sequência <strong>de</strong> pesos: 40,<br />
35, 45, 50, 40, 50, 35 e 45<br />
mo= não existe moda – amodal.<br />
29<br />
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição: mediana<br />
‣ Mediana (md) - é o valor que <strong>de</strong>ixa 50 %<br />
das observações, or<strong>de</strong>nadas, à sua esquerda<br />
ou á direita, isto é, temos o mesmo número<br />
<strong>de</strong> elementos <strong>de</strong> cada lado da mediana.<br />
Para <strong>de</strong>terminar seu valor temos dois casos:<br />
1. Caso ímpar - quando o tamanho da<br />
amostra (n) for ímpar.<br />
2. Caso par - quando Figura o tamanho 4 da amostra<br />
(n) for par.<br />
30<br />
10
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição: mediana<br />
1. Se n for ímpar - localizar exatamente o termo<br />
central da sequência <strong>de</strong> dados, assim,<br />
‣ t = (n +1) / 2, on<strong>de</strong> localizamos o termo da<br />
sequência.<br />
Md = t → é o termo na sequência or<strong>de</strong>nada.<br />
Exemplo: Temos os seguintes pesos (kg): 50, 40,<br />
45, 45 e 55<br />
1º or<strong>de</strong>namos: 40 45 45 50 55<br />
2º encontramos o termo mediano - t= (5+1)/2 =<br />
3º termo<br />
31<br />
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição: mediana<br />
2. Se n for par – será a média das duas<br />
observações centrais, isto é, a média<br />
dos valores dos dois termos centrais:<br />
t1 = n / 2 - localiza o primeiro termo<br />
central<br />
t2 = (n+2) / 2 - localiza o segundo termo<br />
central<br />
md = (t1 + t2) / 2<br />
32<br />
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> posição: mediana<br />
Exemplo: Temos os seguintes pesos (kg):<br />
50, 40, 45, 45, 55 e 50<br />
1º or<strong>de</strong>namos: 40 45 45 50 50 55<br />
2º encontramos os termos mediano<br />
t1 = 6/2 = 3º termo – pegar o 3º termo<br />
t2 = (6+2)/2 = 4º termo – pegar o 4° termo<br />
Portanto a md = (45 + 50)/ 2 = 47,5 kg –<br />
então 50 % dos indivíduos tem peso <strong>de</strong><br />
até 47,5 kg.<br />
33<br />
11
Exercício<br />
Foram selecionados, aleatoriamente, 12<br />
trabalhadores mirins com seus respectivos<br />
salários mensais, em reais. Os dados<br />
encontram-se abaixo:<br />
Dados:<br />
R$110,00 R$120,00 R$110,00 R$150,00<br />
R$140,00 R$150,00 R$120,00 R$110,00<br />
R$140,00 R$180,00 R$180,00 R$120,00.<br />
Encontre as medidas <strong>de</strong>scritivas.<br />
34<br />
Exercício<br />
x (1) = R$ 110,00<br />
x (n) = R$ 180,00<br />
x<br />
= R$ 135,83<br />
Md = R$ 130,00<br />
Mo = R$110,00 e R$ 120,00 (bimodal)<br />
110<br />
110<br />
110<br />
120<br />
120<br />
120<br />
140<br />
140<br />
150<br />
150<br />
180<br />
180<br />
35<br />
Intervalo<br />
36<br />
12
Parte I.II – Análise Descritiva<br />
para variáveis quantitativas –<br />
Medidas <strong>de</strong> dispersão.<br />
37<br />
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> dispersão<br />
(amostral)<br />
As medidas <strong>de</strong> dispersão têm a<br />
finalida<strong>de</strong> <strong>de</strong> encontrar um valor que<br />
resuma a variabilida<strong>de</strong> <strong>de</strong> um conjunto<br />
<strong>de</strong> dados. Algumas medidas estão a<br />
seguir:<br />
a) Amplitu<strong>de</strong>,<br />
b) Variância,<br />
c) Desvio padrão,<br />
d) etc.<br />
38<br />
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> dispersão<br />
‣Amplitu<strong>de</strong> (A), me<strong>de</strong> a<br />
amplitu<strong>de</strong> total dos dados ou o<br />
afastamento entre o maior valor<br />
e o menor.<br />
A = máximo - mínimo<br />
39<br />
13
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> dispersão<br />
‣Variância (Var(X) ou S 2 ), é uma medida<br />
<strong>de</strong> dispersão que me<strong>de</strong> a variabilida<strong>de</strong><br />
dos dados em relação a média.<br />
S 2 =<br />
2<br />
2<br />
2 ( xi<br />
− x)<br />
( x1<br />
− x) + ( x2<br />
− x) + ... + ( x3<br />
− x)<br />
i=<br />
1<br />
=<br />
n − 1 n − 1<br />
n<br />
∑<br />
2<br />
40<br />
Análise <strong>de</strong>scritiva<br />
Medidas <strong>de</strong> dispersão<br />
‣ Desvio padrão (d.p.(X) ou S), me<strong>de</strong><br />
o grau <strong>de</strong> afastamento <strong>de</strong> um conjunto<br />
<strong>de</strong> dados em relação à sua média e<br />
seu calculo é a raiz quadrada da<br />
variância, assim,<br />
S =<br />
Var( x)<br />
41<br />
Retomando o exercício<br />
X: Salários dos trabalhadores mirins<br />
Dados:<br />
R$110,00 R$120,00 R$110,00 R$150,00<br />
R$140,00 R$150,00 R$120,00 R$110,00<br />
R$140,00 R$180,00 R$180,00<br />
R$120,00.<br />
Encontre as medidas <strong>de</strong> dispersão.<br />
42<br />
14
Parte I.III – Análise Descritiva para<br />
variáveis quantitativas – Tabela<br />
<strong>de</strong> frequência<br />
Parte II – Análise Descritiva para<br />
variáveis qualitativas<br />
(Próxima Semana)<br />
43<br />
Alguns Sites on<strong>de</strong> existem dados<br />
estatísticos <strong>de</strong> diversas áreas:<br />
www.ibge.com.br<br />
www.sea<strong>de</strong>.gov.br<br />
Alguns Sites <strong>de</strong> pacotes<br />
computacionais <strong>de</strong> estatística<br />
www.minitab.com.br<br />
www.spss.com.br<br />
44<br />
Boa Semana!<br />
Profa. Cecilia Ap. V. Farhat<br />
45<br />
15