O DBSCAN é um algoritmo de clustering que identifica clusters de pontos densos e lida bem com outliers.
import pandas as pd
import numpy as np
from sklearn.cluster import DBSCAN
import matplotlib.pyplot as plt
# Criar um DataFrame de exemplo
data = {'x': np.random.rand(50), 'y': np.random.rand(50)}
df = pd.DataFrame(data)
# Treinar o modelo DBSCAN
dbscan = DBSCAN(eps=0.1, min_samples=5)
df['cluster'] = dbscan.fit_predict(df)
# Visualizar os clusters
plt.scatter(df['x'], df['y'], c=df['cluster'], cmap='rainbow')
plt.xlabel('X')
plt.ylabel('Y')
plt.title('DBSCAN Clustering')
plt.show()
O K-Means é um algoritmo de agrupamento que agrupa os pontos em clusters e lida bem com outliers.
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
# Criar um DataFrame de exemplo
data = {
'x': np.random.rand(50),
'y': np.random.rand(50)}
df = pd.DataFrame(data)
# Treinar o modelo K-Means
kmeans = KMeans(n_clusters=3)
df['cluster'] = kmeans.fit_predict(df)
# Visualizar os clusters
plt.scatter(df['x'], df['y'], c=df['cluster'], cmap='rainbow')
plt.xlabel('X')
plt.ylabel('Y')
plt.title('K-Means Clustering')
plt.show()
O Mean Shift é um algoritmo de agrupamento que agrupa os pontos em clusters e lida bem com outliers.
import pandas as pd
import numpy as np
from sklearn.cluster import MeanShift
import matplotlib.pyplot as plt # Biblioteca para plotar gráficos
# Criar um DataFrame de exemplo
data = {
'x': np.random.rand(50),
'y': np.random.rand(50)}
df = pd.DataFrame(data)
# Treinar o modelo Mean Shift
meanshift = MeanShift(bandwidth=0.1)
df['cluster'] = meanshift.fit_predict(df)
# Visualizar os clusters
plt.scatter(df['x'], df['y'], c=df['cluster'], cmap='rainbow')
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Mean Shift Clustering')
plt.show()
O Spectral Clustering é um algoritmo de agrupamento que agrupa os pontos em clusters e lida bem com outliers.
import pandas as pd
import numpy as np
from sklearn.cluster import SpectralClustering
import matplotlib.pyplot as plt # Biblioteca para plotar gráficos
# Criar um DataFrame de exemplo
data = {
'x': np.random.rand(50),
'y': np.random.rand(50)}
df = pd.DataFrame(data)
# Treinar o modelo Spectral Clustering
spectral = SpectralClustering(n_clusters=3)
df['cluster'] = spectral.fit_predict(df)
# Visualizar os clusters
plt.scatter(df['x'], df['y'], c=df['cluster'], cmap='rainbow')
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Spectral Clustering')
plt.show()
O Agglomerative Clustering é um algoritmo de agrupamento que agrupa os pontos em clusters e lida bem com outliers.
import pandas as pd
import numpy as np
from sklearn.cluster import AgglomerativeClustering
import matplotlib.pyplot as plt # Biblioteca para plotar gráficos
# Criar um DataFrame de exemplo
data = {
'x': np.random.rand(50),
'y': np.random.rand(50)}
df = pd.DataFrame(data)
# Treinar o modelo Agglomerative Clustering
agglomerative = AgglomerativeClustering(n_clusters=3)
df['cluster'] = agglomerative.fit_predict(df)
# Visualizar os clusters
plt.scatter(df['x'], df['y'], c=df['cluster'], cmap='rainbow')
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Agglomerative Clustering')
plt.show()