Entende-se por população o conjunto de objetos, itens ou eventos com alguma característica ou propriedade comum mensurável, ordenável ou comparável de acordo com os limites propostos e objetivos do estudo.
Sendo assim, forma-se um conjunto de elementos com o universo passível de ser observados, sob as mesmas condições.
Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da população.
A essa parte proveniente da população em estudo determinamos amostra.
Pode-se classificar a população em finita e infinita.
É aquela em que se consegue enumerar todos os elementos que a forma. Refere-se a um universo limitado em uma dada unidade de tempo.
Exemplificando pode-se dizer que a quantidade de automóveis produzidos por uma fábrica em um mês, a população de uma cidade e o número de alunos de uma sala de aula são exemplos de uma população finita.
É aquela cujos elementos não podem ser contados. Refere-se a um universo não delimitado.
Os resultados (cara ou coroa) obtidos em sucessivos lances de uma moeda, o conjunto dos números inteiros, reais ou naturais são exemplos de populações infinitas.
Como em qualquer estudo estatístico tem-se em mente pesquisar uma ou mais características dos elementos de alguma população.
Essa característica deve estar perfeitamente definida e isso se dá quando, considerado um elemento qualquer, podemos afirmar, sem ambiguidade, se esse elemento pertence ou não à população.
Uma amostra é um subconjunto finito de uma população.
Pode até apresentar resultados mais confiáveis: é que poucas consultas permitem contar com pessoal especializado, mais bem qualificado, na sua aplicação.
Exemplo para selecionarmos amostras:
A escolha das amostras poderá ser feita por um dos seguintes processos.
O número de elementos das amostras de cada estrato não precisa ser igual, mas deve respeitar as mesmas proporções.
Se escolhermos uma amostra de 1ª série com muitos alunos e uma de 2ª série com poucos, correremos o risco de ter resultados que não são representativos da população.
A amostragem é a inspeção de parte da população, de um conjunto de entes portadores de pelo menos uma característica comum, que denominamos população estatística ou universo estatístico.
A amostragem oferece vantagens:
Grande parte das pesquisas cientifica ou de resoluções de problemas de engenharia é feita por amostragem, ou seja, observamos apenas um subconjunto de elementos da população.
Observações:
Em geral, o uso de amostragem leva à redução de custos e tempo.
Mas a amostragem precisa ser feita com critérios, pois pretendemos ter amostras que permitam, a partir de uma análise estatística apropriada, obter conclusões satisfatórias sobre toda a população.
Existem várias técnicas de amostragem, cada uma tem vantagens e desvantagens, e a escolha deverá ser feita pelo pesquisador de acordo aos objetivos propostos pela pesquisa.
Os principais métodos de amostragem probabilística são:
Os principais métodos de amostragem não-probabilística são:
Numa escola, os professores de Educação Física resolveram fazer um estudo sobre o “peso” dos alunos da 1ª série do Ensino Médio.
Sabendo que há 400 alunos nessa série, selecione amostras pelos métodos aleatório, sistemático e estratificado.
Para construir uma amostra pelo método da amostragem aleatória, podemos fazer uma lista com os 400 alunos objeto do estudo estatístico, numerada de 1 a 400, e sortear ao acaso 40 números (10% de 400).
Os 40 alunos sorteados serão os componentes da amostra.
Para a amostra pelo método da amostragem sistemática, elaborar a lista como no exemplo anterior; sortear um número de 1 a 10.
Se o número sorteado for 5, por exemplo, formaremos nossa amostra por: 5, 15, 25, 35, 45, 55, 65, 75, 85, 95, 105, 115, 125, 135, até obter os 40 alunos.
Para a amostragem estratificada é preciso considerar o número de alunos por classe de 1ª série e, então, sortear os alunos que participarão da pesquisa em quantidades proporcionais ao número de alunos de cada classe.
Suponhamos que a quantidade de alunos por classe seja a seguinte:
Classe | Alunos |
---|---|
A | 35 |
B | 40 |
C | 45 |
D | 30 |
E | 42 |
F | 36 |
G | 45 |
H | 42 |
I | 45 |
J | 40 |
Sabemos que nossa amostra deve ter 40 alunos tomados de 10 classes.
Para a constituição da amostra precisamos, em primeiro lugar, calcular a porcentagem de alunos de cada classe em relação à população de 400 alunos.
Turma | Alunos | % |
---|---|---|
A | 35 | 8,75 |
B | 40 | 10 |
C | 45 | 11,25 |
D | 30 | 7,5 |
E | 42 | 10,5 |
F | 36 | 9 |
G | 45 | 11,25 |
H | 42 | 10,5 |
I | 45 | 11,5 |
J | 40 | 10 |
Total | 400 | 100 |
A turma A, com 35 alunos, tem 8,75% dos elementos da população, logo, na amostra, 8,75% dos elementos deverão ser dessa classe.
O mesmo deve ser utilizado para as demais classes.
Como precisamos de uma amostra de 40 alunos, calculamos:
A: 8,75% de 40 são 3,5 = 4 alunos |
B: 10% de 40 são 4 alunos |
C: 11,25% de 40 são 4,5 = 4 alunos |
D: 7,5% de 40 são 3 alunos |
E: 10,5% de 40 são 4,2 = 4 alunos |
F: 9% de 40 são 3,6 = 4 alunos |
G: 11,25% de 40 são 4,5 = 4 alunos |
H: 10,5% de 40 são 4,2 = 4 alunos |
I: 11,5% de 40 são 4,6 = 5 alunos |
J: 10% de 40 são 4 alunos |
Observe que esses dados foram arredondados para o inteiro mais próximo porque indicam números discretos de alunos.
Podemos organizar uma tabela:
Classe | Alunos | % | Amostra |
---|---|---|---|
A | 35 | 8,75 | 4 |
B | 40 | 10 | 4 |
C | 45 | 11,25 | 4 |
D | 30 | 7,5 | 3 |
E | 42 | 10,5 | 4 |
F | 36 | 9 | 4 |
G | 45 | 11,25 | 4 |
H | 42 | 10,5 | 4 |
I | 45 | 11,5 | 5 |
J | 40 | 10 | 4 |
Total | 400 | 100 | 40 |
Observação: Na última coluna da tabela está representada a quantidade de alunos de cada classe que comporá a amostra. A escolha desses alunos poderá ser feita por um dos processos anteriores.
As variáveis, nos estudos estatísticos, são os valores que assumem determinadas características dentro de uma pesquisa e podem ser classificadas em qualitativas ou quantitativas, ou seja, as variáveis podem ter valores numéricos ou não numéricos.
As variáveis qualitativas não podem ser expressas numericamente, pois relacionam situações como a cor da pele, cor dos olhos, marca de refrigerante, marca de automóvel, preferência musical entre outras.
Elas podem ser divididas em ordinais e nominais. As variáveis qualitativas ordinais, apesar de não serem numéricas, obedecem a uma relação de ordem, por exemplo: conceitos como ótimo, bom, regular e ruim, classe social, grau de instrução, etc.
Já as variáveis qualitativas nominais não estão relacionadas à ordem, elas são identificadas apenas por nomes, por exemplo, as cores: vermelho, amarelo, preto, azul, rosa, verde, etc.
Também como exemplo de nominais temos as marcas de carros, nome de bebidas, local de nascimento entre outros.
Resumindo, uma variável é qualitativa quando seus valores são expressos por atributos.
No caso das variáveis quantitativas usamos a representação numérica. Elas podem ser classificadas em discretas e contínuas.
As variáveis quantitativas discretas acontecem relacionadas a situações limitadas, por exemplo: número de revistas vendidas, quantidade de consultas médicas, número de filhos de um casal.
No caso das variáveis quantitativas contínuas, a abrangência pertence a um intervalo que se caracteriza por infinitos valores, como exemplo podemos citar: o peso de um produto, altura dos alunos de uma escola, velocidade de objetos, entre outras situações.
Uma variável originalmente quantitativa pode ser coletada de forma qualitativa.
Por exemplo, a variável idade é quantitativa (contínua) se for medida em anos completos; mas é qualitativa (ordinal) se for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc...).
Outro exemplo é o peso dos lutadores de boxe, uma variável quantitativa (contínua) se trabalharmos com o valor obtido na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado, etc.).
Outro ponto importante é que nem sempre uma variável representada por números é quantitativa. O número do telefone de uma pessoa, o número da casa, o número de sua identidade.
Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea, por exemplo.
Isto não significa que a variável sexo passou a ser quantitativa.
Em síntese: As características das populações são chamadas de variáveis, que podem ser divididas em:
É o exame completo de toda uma população.
Quanto maior for a amostra, mais precisas e confiáveis serão as induções feitas sobre a população
Assim, resultados mais perfeitos serão obtidos pelo censo.
No entanto, muitas vezes o emprego de amostras, com certo rigor técnico, pode levar a resultados mais confiáveis ou até mesmo melhores daqueles que seriam obtidos mediante um censo.
As razões para se recorrer a amostras são o menor custo e tempo para levantamento dos dados e a possibilidade de melhor investigação dos elementos observados.