Estatística Básica
Carregando, aguarde alguns segundos.

2 - População e Amostra

Entende-se por população o conjunto de objetos, itens ou eventos com alguma característica ou propriedade comum mensurável, ordenável ou comparável de acordo com os limites propostos e objetivos do estudo.

Sendo assim, forma-se um conjunto de elementos com o universo passível de ser observados, sob as mesmas condições.

Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da população.

A essa parte proveniente da população em estudo determinamos amostra.

2.1 - População

Pode-se classificar a população em finita e infinita.

2.1.1 - População Finita

É aquela em que se consegue enumerar todos os elementos que a forma. Refere-se a um universo limitado em uma dada unidade de tempo.

Exemplificando pode-se dizer que a quantidade de automóveis produzidos por uma fábrica em um mês, a população de uma cidade e o número de alunos de uma sala de aula são exemplos de uma população finita.

2.1.2 - População Infinita

É aquela cujos elementos não podem ser contados. Refere-se a um universo não delimitado.

Os resultados (cara ou coroa) obtidos em sucessivos lances de uma moeda, o conjunto dos números inteiros, reais ou naturais são exemplos de populações infinitas.

Como em qualquer estudo estatístico tem-se em mente pesquisar uma ou mais características dos elementos de alguma população.

Essa característica deve estar perfeitamente definida e isso se dá quando, considerado um elemento qualquer, podemos afirmar, sem ambiguidade, se esse elemento pertence ou não à população.

2.2 - Amostra

Uma amostra é um subconjunto finito de uma população.

Pode até apresentar resultados mais confiáveis: é que poucas consultas permitem contar com pessoal especializado, mais bem qualificado, na sua aplicação.

Exemplo para selecionarmos amostras:

  • Para realização de um estudo sobre as preferências musicais entre os 5.000 alunos de uma escola, como escolheríamos uma amostra?
  • Para correr menos riscos de chegar a conclusões erradas, devemos estabelecer um número mínimo de elementos para compor a amostra, que não deve ser inferior a 10% do total de elementos da população.
  • Assim, nossa amostra deve ser de, pelo menos, 500 alunos.

A escolha das amostras poderá ser feita por um dos seguintes processos.

  • Amostragem aleatória (ao acaso): todos os elementos da população têm igual possibilidade de serem selecionados para constituir a amostra. No nosso exemplo, poderíamos atribuir um número a cada aluno da escola e escolher ao acaso 50 números para obter os 50 alunos que constituem a amostra.
  • Amostragem sistemática: os elementos são selecionados para a amostra por um sistema preestabelecido. No caso dos alunos, considerando-os ainda numerados, poderíamos escolher os números segundo uma lei de formação: 2,4,6,8 e, assim, sucessivamente, até obtermos os 50 alunos.
  • Amostragem estratificada: é utilizada quando a população está dividida em estratos ou grupos diferenciados. No exemplo dos alunos da escola podemos considerar cada série de escolaridade como um estrato e assim escolher, em cada uma, um determinado número de alunos, isto é, uma amostra dentro de cada estrato.

O número de elementos das amostras de cada estrato não precisa ser igual, mas deve respeitar as mesmas proporções.

Se escolhermos uma amostra de 1ª série com muitos alunos e uma de 2ª série com poucos, correremos o risco de ter resultados que não são representativos da população.

2.2.1 - Amostragem

A amostragem é a inspeção de parte da população, de um conjunto de entes portadores de pelo menos uma característica comum, que denominamos população estatística ou universo estatístico.

A amostragem oferece vantagens:

  • Mais econômica
  • Mais rápida (reduz o número de dados)
  • Incomoda menos (consultando menos pessoas)

Grande parte das pesquisas cientifica ou de resoluções de problemas de engenharia é feita por amostragem, ou seja, observamos apenas um subconjunto de elementos da população.

Observações:

  • Populações são grandes ou infinitas
  • Observações e mensurações têm alto custo
  • As medições podem exigir testes destrutivos
  • Há necessidade de rapidez etc

Em geral, o uso de amostragem leva à redução de custos e tempo.

Mas a amostragem precisa ser feita com critérios, pois pretendemos ter amostras que permitam, a partir de uma análise estatística apropriada, obter conclusões satisfatórias sobre toda a população.

Existem várias técnicas de amostragem, cada uma tem vantagens e desvantagens, e a escolha deverá ser feita pelo pesquisador de acordo aos objetivos propostos pela pesquisa.

Os principais métodos de amostragem probabilística são:

  • Aleatório
  • Sistemático
  • Estratificado proporcional

Os principais métodos de amostragem não-probabilística são:

  • Acidental
  • Voluntários
  • Escolhas racionais
  • Julgamento especializado

2.2.2 - Exercício resolvido

Numa escola, os professores de Educação Física resolveram fazer um estudo sobre o “peso” dos alunos da 1ª série do Ensino Médio.

Sabendo que há 400 alunos nessa série, selecione amostras pelos métodos aleatório, sistemático e estratificado.

2.2.2.1 - Método Aleatório

Para construir uma amostra pelo método da amostragem aleatória, podemos fazer uma lista com os 400 alunos objeto do estudo estatístico, numerada de 1 a 400, e sortear ao acaso 40 números (10% de 400).

Os 40 alunos sorteados serão os componentes da amostra.

2.2.2.2 - Método Sistemático

Para a amostra pelo método da amostragem sistemática, elaborar a lista como no exemplo anterior; sortear um número de 1 a 10.

Se o número sorteado for 5, por exemplo, formaremos nossa amostra por: 5, 15, 25, 35, 45, 55, 65, 75, 85, 95, 105, 115, 125, 135, até obter os 40 alunos.

2.2.2.3 - Método Estratificado

Para a amostragem estratificada é preciso considerar o número de alunos por classe de 1ª série e, então, sortear os alunos que participarão da pesquisa em quantidades proporcionais ao número de alunos de cada classe.

Suponhamos que a quantidade de alunos por classe seja a seguinte:

Classe Alunos
A 35
B 40
C 45
D 30
E 42
F 36
G 45
H 42
I 45
J 40

Sabemos que nossa amostra deve ter 40 alunos tomados de 10 classes.

Para a constituição da amostra precisamos, em primeiro lugar, calcular a porcentagem de alunos de cada classe em relação à população de 400 alunos.

Turma Alunos %
A 35 8,75
B 40 10
C 45 11,25
D 30 7,5
E 42 10,5
F 36 9
G 45 11,25
H 42 10,5
I 45 11,5
J 40 10
Total 400 100

A turma A, com 35 alunos, tem 8,75% dos elementos da população, logo, na amostra, 8,75% dos elementos deverão ser dessa classe.

O mesmo deve ser utilizado para as demais classes.

Como precisamos de uma amostra de 40 alunos, calculamos:

A: 8,75% de 40 são 3,5 = 4 alunos
B: 10% de 40 são 4 alunos
C: 11,25% de 40 são 4,5 = 4 alunos
D: 7,5% de 40 são 3 alunos
E: 10,5% de 40 são 4,2 = 4 alunos
F: 9% de 40 são 3,6 = 4 alunos
G: 11,25% de 40 são 4,5 = 4 alunos
H: 10,5% de 40 são 4,2 = 4 alunos
I: 11,5% de 40 são 4,6 = 5 alunos
J: 10% de 40 são 4 alunos

Observe que esses dados foram arredondados para o inteiro mais próximo porque indicam números discretos de alunos.

Podemos organizar uma tabela:

Classe Alunos % Amostra
A 35 8,75 4
B 40 10 4
C 45 11,25 4
D 30 7,5 3
E 42 10,5 4
F 36 9 4
G 45 11,25 4
H 42 10,5 4
I 45 11,5 5
J 40 10 4
Total 400 100 40

Observação: Na última coluna da tabela está representada a quantidade de alunos de cada classe que comporá a amostra. A escolha desses alunos poderá ser feita por um dos processos anteriores.

2.3 - Variáveis

As variáveis, nos estudos estatísticos, são os valores que assumem determinadas características dentro de uma pesquisa e podem ser classificadas em qualitativas ou quantitativas, ou seja, as variáveis podem ter valores numéricos ou não numéricos.

Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.

As variáveis qualitativas não podem ser expressas numericamente, pois relacionam situações como a cor da pele, cor dos olhos, marca de refrigerante, marca de automóvel, preferência musical entre outras.

Elas podem ser divididas em ordinais e nominais. As variáveis qualitativas ordinais, apesar de não serem numéricas, obedecem a uma relação de ordem, por exemplo: conceitos como ótimo, bom, regular e ruim, classe social, grau de instrução, etc.

Já as variáveis qualitativas nominais não estão relacionadas à ordem, elas são identificadas apenas por nomes, por exemplo, as cores: vermelho, amarelo, preto, azul, rosa, verde, etc.

Também como exemplo de nominais temos as marcas de carros, nome de bebidas, local de nascimento entre outros.

Resumindo, uma variável é qualitativa quando seus valores são expressos por atributos.

No caso das variáveis quantitativas usamos a representação numérica. Elas podem ser classificadas em discretas e contínuas.

As variáveis quantitativas discretas acontecem relacionadas a situações limitadas, por exemplo: número de revistas vendidas, quantidade de consultas médicas, número de filhos de um casal.

No caso das variáveis quantitativas contínuas, a abrangência pertence a um intervalo que se caracteriza por infinitos valores, como exemplo podemos citar: o peso de um produto, altura dos alunos de uma escola, velocidade de objetos, entre outras situações.

Uma variável originalmente quantitativa pode ser coletada de forma qualitativa.

Por exemplo, a variável idade é quantitativa (contínua) se for medida em anos completos; mas é qualitativa (ordinal) se for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc...).

Outro exemplo é o peso dos lutadores de boxe, uma variável quantitativa (contínua) se trabalharmos com o valor obtido na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado, etc.).

Outro ponto importante é que nem sempre uma variável representada por números é quantitativa. O número do telefone de uma pessoa, o número da casa, o número de sua identidade.

Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea, por exemplo.

Isto não significa que a variável sexo passou a ser quantitativa.

Em síntese: As características das populações são chamadas de variáveis, que podem ser divididas em:

  • Qualitativas:: nominal (sexo, cor dos olhos...); ordinal (classe social, grau de instrução...)
  • Quantitativas:: contínua (peso, altura...); discreta (número de filhos, número de carros...)

2.4 - Censo

É o exame completo de toda uma população.

Quanto maior for a amostra, mais precisas e confiáveis serão as induções feitas sobre a população

Assim, resultados mais perfeitos serão obtidos pelo censo.

No entanto, muitas vezes o emprego de amostras, com certo rigor técnico, pode levar a resultados mais confiáveis ou até mesmo melhores daqueles que seriam obtidos mediante um censo.

As razões para se recorrer a amostras são o menor custo e tempo para levantamento dos dados e a possibilidade de melhor investigação dos elementos observados.

Arduino
Coautor
Betobyte
Autor
Autores
||| Áreas ||| Estatística ||| Python ||| Projetos ||| Dicas & Truques ||| Quantum ||| Estatística Básica || Estatística Básica || Estatistica Avançada || Bayes || Aulas | Conceitos Fundamentais (Conceitos fundamentais e compreensão da estatística, tratando da coleta, da análise, da interpretação e da apresentação de massas de dados numéricos, também significando um conjunto de dados numéricos.) | População e Amostra (População e amostra como um conjuntos de objetos, itens ou eventos com alguma característica ou propriedade comum mensurável, ordenável ou comparável de acordo com os limites propostos e objetivos do estudo.) | Séries Estatísticas (Séries estatísticas como distribuição de conjuntos de dados estatísticos em função da época, do local ou da espécie (fenômeno).) | Gráficos Estatísticos (Representação gráfica estabelecendo correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional.) | Distribuição de Frequência (Distribuição de Frequência como conjunto de dados em uma tabela conforme as frequências ou repartições de seus valores, podendo ser discreta ou contínua de uma série estatística em que permanecem constantes o fato, o local e a época em que o fenômeno ocorreu.) | Medidas de Posição (Medidas de posição com a localização da maior concentração de valores de uma distribuição, isto é, se ela se localiza no início, no meio ou no final, ou, ainda, se há uma distribuição por igual.) | Medidas de Dispersão (Medidas de dispersão ou variabilidade empregadas na descoberta do grau de variabilidade ou dispersão dos valores observados em torno da média aritmética, medindo a representatividade da média e destacam o nível de homogeneidade ou heterogeneidade dentro de cada grupo estatístico analisado.) | Medidas de Assimetria/Curtose (Medidas de forma por descreverem a forma da curva de distribuição dos dados, indicando o grau de assimetria de uma distribuição de frequências unimodal em relação a uma linha vertical que passa por seu ponto mais elevado ou o grau de achatamento de uma distribuição em relação a distribuição padrão denominada curva normal.) | Probabilidade (O cálculo de probabilidades é uma necessidade essencial para o estudo de Estatística Indutiva (ou Inferencial) pelo fato de a maioria dos fenômenos tratados na Estatística serem de natureza aleatória ou probabilística.) | Distribuição Binomial (A probabilidade de ocorrerem k sucessos e (n–k) fracassos dada pelo termo geral do Binômio de Newton.) |