10 - Pacotes dplyr, caret e vip para R

No R, pacotes como dplyr, caret e vip são amplamente utilizados para manipulação de dados, modelagem de aprendizado de máquina e visualização de importância de variáveis.

Exemplo: Manipulação de dados e modelagem em R

# Carregar os pacotes necessários
library(dplyr)
library(caret)
library(vip)

# Criar um DataFrame de exemplo
data <- data.frame(
  nome = c('Alice', 'Bob', 'Charlie', 'David', 'Eve'),
  idade = c(24, 27, 22, 32, 29),
  cidade = c('São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Curitiba', 'Porto Alegre')
)

# Manipulação de dados com dplyr
data_filtrado <- data %>%
  filter(idade > 25) %>%
  mutate(salario = c(50000, 54000, 61000, 58000, 62000))
print(data_filtrado)

# Divisão dos dados em conjunto de treinamento e teste
set.seed(42)
trainIndex <- createDataPartition(data_filtrado$salario, p = .8, 
                                  list = FALSE, 
                                  times = 1)
dataTrain <- data_filtrado[ trainIndex,]
dataTest  <- data_filtrado[-trainIndex,]

# Treinamento de um modelo de regressão linear com caret
modelo <- train(salario ~ idade, data = dataTrain, method = 'lm')

# Previsão e avaliação do modelo
previsoes <- predict(modelo, newdata = dataTest)
print(previsoes)

# Visualização da importância das variáveis com vip
vip(modelo)

Arduino

Coautor

Betobyte

Autor

Autores

||| Áreas ||| Estatística ||| Python ||| Projetos ||| Dicas & Truques ||| Quantum ||| Python com ML Básico || Python para Iniciantes || Python Básico || Matplotlib || Numpy || Seaborn || Pandas || Django || Estatística para Cientistas de Dados || Python com ML Básico || Python com ML Básico || Aulas | Introdução (Introdução) | Guia Rápido do Python (Guia Rápido do Python) | Aprendizado (Aprendizado supervisionado, não supervisionado e por reforço) | Modelos (Modelos de Regressão e Classificação) | Agrupamento (Algoritmos de Agrupamento) | Pre-processamento de Dados (Pré-processamento de dados e técnicas de engenharia de características) | Métricas (Métricas de avaliação para modelos de ML) | Treinamento e Avaliação (Funções para pré-processamento de dados, treinamento de modelos e avaliação) | Seaborn e Matplotlib (Seaborn e Matplotlib para visualização) | Pandas (Pandas para processamento) | Scikit-learn (Scikit-learn, uma biblioteca de ML em Python) | R (Pacotes dplyr, caret e vip para R) | Emsemble e RNA (Métodos de ensemble e redes neurais artificiais) | Aplicações (Aplicações de aprendizado de máquina) | Matemática (Fundamentos matemáticos para ML) | Otimização (Métodos de otimização e treinamento de modelos) | Problemas Comuns (Problemas comuns de ML e MLOps) | Ferramentas de Nuvem (Ferramentas baseadas em nuvem como GCP, AWS e Microsoft Azure) | Frameworks e Bibliotecas DL (Ferramentas de MLOps de código aberto como MLflow) | Ajustes de Hiperparâmetros (Técnicas de ajuste de hiperparâmetros como grid search e random search) | Frameworks e Biblioteca DL (Frameworks e bibliotecas de deep learning como PyTorch e TensorFlow) | Implementação (Implementar soluções de ML com conjuntos de dados do mundo real) | NLP (Visão computacional e Processamento de Linguagem Natural (NLP)) | Arquiteturas DL (Arquiteturas avançadas de deep learning como RNNs e GANs) | Arquiteturas LLM (Arquiteturas de transformadores em LLMs (BERT e GPT)) | Design (Design de aprendizado por reforço e RAG) | Ciclo de Vida de MLOps (Ciclo de vida de MLOps e últimas tendências de pesquisa em ML) | Provedores (Provedores de nuvem e ferramentas de código aberto para ciclo de vida completo de MLOps) | Frameworks RL (Frameworks de aprendizado por reforço como OpenAI Gym) | Ferramentas LLM (Langchain e ferramentas similares para LLMs customizados) | Repositórios LLKM (Desenvolver ou usar LLMs de repositórios como Hugging Face) | Arquitetura DL (Arquiteturas de deep learning com TensorFlow / PyTorch) |