No R, pacotes como dplyr, caret e vip são amplamente utilizados para manipulação de dados, modelagem de aprendizado de máquina e visualização de importância de variáveis.
Exemplo: Manipulação de dados e modelagem em R
# Carregar os pacotes necessários
library(dplyr)
library(caret)
library(vip)
# Criar um DataFrame de exemplo
data <- data.frame(
nome = c('Alice', 'Bob', 'Charlie', 'David', 'Eve'),
idade = c(24, 27, 22, 32, 29),
cidade = c('São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Curitiba', 'Porto Alegre')
)
# Manipulação de dados com dplyr
data_filtrado <- data %>%
filter(idade > 25) %>%
mutate(salario = c(50000, 54000, 61000, 58000, 62000))
print(data_filtrado)
# Divisão dos dados em conjunto de treinamento e teste
set.seed(42)
trainIndex <- createDataPartition(data_filtrado$salario, p = .8,
list = FALSE,
times = 1)
dataTrain <- data_filtrado[ trainIndex,]
dataTest <- data_filtrado[-trainIndex,]
# Treinamento de um modelo de regressão linear com caret
modelo <- train(salario ~ idade, data = dataTrain, method = 'lm')
# Previsão e avaliação do modelo
previsoes <- predict(modelo, newdata = dataTest)
print(previsoes)
# Visualização da importância das variáveis com vip
vip(modelo)