O Curso Básico apresenta os conceitos fundamentais sobre populações e amostras, séries e gráficos estatísticos, distribuição de frequência, medidas (posição, dispersão/variabilidade, assimetria/curtose), probabilidade e distribuição binomial.
Estatística Básica
Estatística básica com conceitos fundamentais e compreensão da estatística, de população e amostra, gráficos e séries estatísticas e distribuição de frequência.
Conceitos fundamentais e compreensão da estatística, tratando da coleta, da análise, da interpretação e da apresentação de massas de dados numéricos, também significando um conjunto de dados numéricos.
População e amostra como um conjuntos de objetos, itens ou eventos com alguma característica ou propriedade comum mensurável, ordenável ou comparável de acordo com os limites propostos e objetivos do estudo.
Séries estatísticas como distribuição de conjuntos de dados estatísticos em função da época, do local ou da espécie (fenômeno).
Representação gráfica estabelecendo correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional.
Distribuição de Frequência como conjunto de dados em uma tabela conforme as frequências ou repartições de seus valores, podendo ser discreta ou contínua de uma série estatística em que permanecem constantes o fato, o local e a época em que o fenômeno ocorreu.
Medidas de posição com a localização da maior concentração de valores de uma distribuição, isto é, se ela se localiza no início, no meio ou no final, ou, ainda, se há uma distribuição por igual.
Medidas de dispersão ou variabilidade empregadas na descoberta do grau de variabilidade ou dispersão dos valores observados em torno da média aritmética, medindo a representatividade da média e destacam o nível de homogeneidade ou heterogeneidade dentro de cada grupo estatístico analisado.
Medidas de forma por descreverem a forma da curva de distribuição dos dados, indicando o grau de assimetria de uma distribuição de frequências unimodal em relação a uma linha vertical que passa por seu ponto mais elevado ou o grau de achatamento de uma distribuição em relação a distribuição padrão denominada curva normal.
O cálculo de probabilidades é uma necessidade essencial para o estudo de Estatística Indutiva (ou Inferencial) pelo fato de a maioria dos fenômenos tratados na Estatística serem de natureza aleatória ou probabilística.
A probabilidade de ocorrerem k sucessos e (n–k) fracassos dada pelo termo geral do Binômio de Newton.
Estatistica Avançada
Compreensão sólida e abrangente de técnicas estatísticas avançadas, como aplicá-las em problemas complexos de análise de dados, usando testes de hipóteses e inferência estatística, modelos de regressão e modelos lineares generalizados, análise de variância e experimentos, séries temporais, análise multivariada, métodos Bayesianos, métodos de simulação, métodos de amostragem, análise de sobrevivência, análise de dados longitudinais, análise espacial e de métodos não-paramétricos
Visão geral do curso, revisão de conceitos fundamentais.
Gráficos básicos e visualizações avançadas, medidas de tendência central e dispersão robustasa, análise de correlação e covariância multivariada, análise de componentes principais e análise fatorial.
Testes não paramétricos, de aderência e independência, de estimação de parâmetros e intervalos de confiança avançados, de hipóteses múltiplas e ajustes de p-valor, e métodos bootstrap e de permutação.
Regressão linear múltipla, modelos de regressão não linear, modelos lineares generalizados, análise de sobrevivência e modelos de risco proporcional, regressão robusta e regressão de quantis
Modelos de Poisson e regressão de Poisson, modelos de regressão logística, modelos de resposta nominal e ordinal, modelos de contagem multivariada, modelos de regressão com erros de medição
Análise de variância de um fator e multifatorial, planejamento de experimentos e blocos incompletos, análise de covariância, análise de medidas repetidas e modelos mistos
Modelos autoregressivos (AR) e de médias móveis (MA), modelos ARMA e ARIMA, modelos de séries temporais multivariadas, modelos de componentes sazonais, previsão e diagnóstico em séries temporais
Análise de agrupamento (cluster analysis), análise de componentes principais (PCA) multivariada, análise discriminante e classificação, análise de correspondência e análise de escalonamento multidimensional, análise de redes e modelos de grafos
Fundamentos da inferência bayesiana, modelagem bayesiana de regressão, amostradores de Gibbs e Metropolis-Hastings, modelos hierárquicos e mistos, inferência bayesiana não paramétrica, modelos de mistura e clustering bayesiano, avaliação e seleção de modelos bayesianos
Simulação Monte Carlo, técnicas de redução de variância, amostragem por importância, cadeias de Markov e amostradores de Monte Carlo baseados em cadeias, modelagem e simulação de eventos discretos
Funções de sobrevivência e estimadores não paramétricos, modelos de risco proporcional de Cox, modelos de riscos competitivos, modelos paramétricos de distribuição de tempo até o evento, avaliação e seleção de modelos de sobrevivência
Amostragem aleatória simples e estratificada, amostragem por conglomerados e multiestágio, métodos de amostragem complexa e ponderação, amostragem de redes sociais e amostragem baseada em contatos, amostragem adaptativa e métodos não probabilísticos
Modelos lineares generalizados mistos, modelos lineares generalizados para medidas repetidas, modelos de crescimento e trajetórias, modelos de equações de estimativas generalizadas (GEE), análise de dados de painel
Autocorrelação espacial e estatísticas de Moran, interpolação espacial e krigagem, modelos de regressão espacial, clusterização espacial e detecção de aglomerados, visualização e análise exploratória de dados espaciais
Testes de hipóteses não paramétricos, estimação de densidade e regressão não paramétrica, métodos de bootstrap não paramétrico, árvores de decisão e florestas aleatórias, métodos não paramétricos avançados
Bayes
O Teorema de Bayes se tornou um dos princípios fundamentais da estatística bayesiana e é amplamente aplicado em diversas áreas, desde análise de dados até aprendizado de máquina, com os avanços computacionais e a disponibilidade de métodos eficientes de inferência bayesiana.
Introdução a uma das ferramentas fundamentais mais importantes da teoria das probabilidades, com aplicação em diversas áreas, incluindo estatística, inteligência artificial, aprendizado de máquina e ciência de dados.
Teoria de Decisão Bayesiana, probabilidade anterior e de verossimilhança, soma das probabilidades, evidências, aprendizado de Máquina e Teoria de Decisão Bayesiana, computação na Teoria da Decisão Bayesianas
Abordagem estatística que se baseia no Teorema de Bayes para fazer inferências sobre parâmetros desconhecidos ou realizar previsões, levando em consideração a probabilidade de um evento ocorrer, da probabilidade de um evento ocorrer é atualizada à medida que novas evidências são coletadas.
Papel significativo da estatística bayesiana na área de inteligência artificial (IA), fornecendo uma estrutura para a tomada de decisões probabilísticas e o aprendizado adaptativo dos sistemas.
Python
O Python é amplo e vai do básico aos módulos MatPlotLib, NumPy, Pandas e Django, e muito mais.
Python para Iniciantes
Python básico para iniciantes
Instalação, variáveis e tipos de dados, operações, formatação e comentários.
barras, radar, nuvem de palavras, paralelas, pirulito, barras circulares
Gráfico de dispersão 3D, GD 3D com autovetores, Cubo 3D, Distribuição Gaussiana Multivariada com superfície colorida, DGM como grade de malha, Gráfico de Barras Vertical com barras de erro, GB horizontal com barras de erro, GB back-to-back, GB agrupadas, GB empilhadas, GB com rótulos, GB com rotação, GB com gradiente de cores, preenchimento de padrão, Gráficos de Caixa (boxplot), GC preta e branca, GC, horizontal, GC cheia, GC personalizadas, GC e barra de violinos, GC simples, subplots, cores, eixo estético, rótulos personalizados, linhas de grade, folhas de estilos, mapas de calor, de cores, histogramas, e mais.
Numpy
Numpy (Básico)
introdução
Desempenho
ufunc
random
Seaborn
Distribuições com Seaborn
Distribuições com Seaborn
Pandas
Curso para criação, manipulação e análise de estruturas de dados, como Séries e DataFrames, a partir do carregamento de dados de diferentes fontes, como arquivos CSV, JSON e SQL, entre outros, com visualização de dados com o Pandas, utilizando bibliotecas como Matplotlib e Seaborn, e análises estatísticas básicas, como média, desvio padrão, correlação e regressão.
introdução
Series
Dataframes
limpeza
correlações
plotagem pandas
Seleções pandas
Pandas x SQL
Django
Django proporciona a criação do ambiente web.
models, views, templates
ambiente virtual, projeto, aplicativo, banco de dados
templates HTML e tags django
consultas de dados com querysets
Estatística para Cientistas de Dados
Estatística Prática para Cientistas de Dados.
Introdução
Análise de dados exploratória
Dados e exemplos de distribuições
Experimentos estatísticos e testes de significância
Regressão e previsão
Regressão e previsão
Aprendizado de máquina estatístico
Aprendizado não supervisionado
Python com ML Básico
Curso com conceitos e tecnologias para o aprendizado de máquina.
Introdução ao ML
Programação, dados, modelos, algoritmos, tipos, treinamento, teste, avaliação e Métricas, generalização, engenharia de características, viés (bias) e interpretabilidade, tamanho do conjunto de dados, hiperparâmetros
Curso com conceitos e tecnologias para o aprendizado de máquina.
Introdução
Guia Rápido do Python
Aprendizado supervisionado, não supervisionado e por reforço
Modelos de Regressão e Classificação
Algoritmos de Agrupamento
Pré-processamento de dados e técnicas de engenharia de características
Métricas de avaliação para modelos de ML
Funções para pré-processamento de dados, treinamento de modelos e avaliação
Seaborn e Matplotlib para visualização
Pandas para processamento
Scikit-learn, uma biblioteca de ML em Python
Pacotes dplyr, caret e vip para R
Métodos de ensemble e redes neurais artificiais
Aplicações de aprendizado de máquina
Fundamentos matemáticos para ML
Métodos de otimização e treinamento de modelos
Problemas comuns de ML e MLOps
Ferramentas baseadas em nuvem como GCP, AWS e Microsoft Azure
Ferramentas de MLOps de código aberto como MLflow
Técnicas de ajuste de hiperparâmetros como grid search e random search
Frameworks e bibliotecas de deep learning como PyTorch e TensorFlow
Implementar soluções de ML com conjuntos de dados do mundo real
Visão computacional e Processamento de Linguagem Natural (NLP)
Arquiteturas avançadas de deep learning como RNNs e GANs
Arquiteturas de transformadores em LLMs (BERT e GPT)
Design de aprendizado por reforço e RAG
Ciclo de vida de MLOps e últimas tendências de pesquisa em ML
Provedores de nuvem e ferramentas de código aberto para ciclo de vida completo de MLOps
Frameworks de aprendizado por reforço como OpenAI Gym
Langchain e ferramentas similares para LLMs customizados
Desenvolver ou usar LLMs de repositórios como Hugging Face
Arquiteturas de deep learning com TensorFlow / PyTorch
Projetos
Projetos de Ciência de Dados.
Estudos BOVESPA
Estudos BOVESPA ensina a acessar os dados da BOVESPA em tempo real, e construir gráficos de linha, bollinger, histogramas, 3D e correlações, análise de padrões e consulta direta na B3 e salvamento de dados em um banco de dados SQLite.
Apresentação do contexto
gráficos de linha, bollinger, histogramas
3D e correlações
Análise de padrões e consulta direta na B3
Banco de dados SQLite de cotações
Dicas & Truques
Dicas & Truques de Python e Estatística.
Dicas
Dicas de Python e Estatística.
Diagrama do Gráfico
Gráfico de Bolhas
Gráfico de Barras Coloridas
Gráfico de Barras Circulares
Quantum
Mundo Quantum
Programação Quântica
Curso Básico de Mecânica, Computação e Programação Quânticas
Introdução à Mecânica, Computação e Programação Quânticas
Mecânica Quântica
Modelos de Bohr e Shrödinger para o átomo de hidrogênio
Computação Quântica
Programação Quântica
Programação Quântica com Qiskit
Computadores quânticos reais com a IBM Quantum Experience