A biblioteca Matplotlib de plotagem de gráficos de alto nível visual em Python, permite a visualização gráfica de dados, sendo extremamente rápida por ser escrita com a linguagem C.
Foi criada em 2003 por John D. Hunter, um neurocientista que usava MATLAB e queria aperfeiçoar a visualização de dados obtidos por meio de EEGs (eletroencelografia) em sua pesquisa sobre epilepsia.
A visualização gráfica de dados envolve basicamente a análise exploratória de dados (EDA) e plotagens gráficas, sendo uma das habilidades críticas esperadas dos cientistas de dados.
A maioria dos "problemas de negócios" pode ser entendida de forma mais eficaz usando-se as técnicas de visualização dos padrões dos dados.
Outra vantagem da visualização gráfica é simplificar os dados complexos em um formato compreensível, pois é mais fácil a visualização de dados com imagens do que com muitos textos e números.
A visualização é a melhor plataforma de comunicação para a análise e interpretação de dados, ajudando as pessoas a entender facilmente grandes quantidades de informações, tendências, correlações, padrões, distribuições etc.
O Matplotlib tem código aberto que pode ser usado livremente, com o código-fonte no repositório do github https://github.com/matplotlib/matplotlib.
Roberto Teixeira
Betobyte
Cientista de Dados
CIEDA
cieda.com.br
roberto@cieda.com.br
Carlos Delfino
Arduino
Cientista de Dados
Basicão da Eletrônica
www.carlosdelfino.eti.br
consultoria@carlosdelfino.eti.br
Para instalar o pacote Matplotlib utilize o PIP no prompt de comandos do SO.
pip install matplotlib
Após o Matplotlib ser instalado, pode ser importado em suas instruções e aplicativos.
import matplotlib
Agora o Matplotlib está importado e pronto para uso.
Veja a versão do pacote com o atributo __version__, inclusive para verificar se o matplotlib está instalado corretamente.
matplotlib.__version__
A maioria dos recursos do Matplotlib está presente no módulo Pyplot.
O Pyplot é comumente importado com o alias plt:
import matplotlib.pyplot as plt
Agora, o módulo Pyplot pode ser referido com plt.
Exemplo: desenhe uma linha em um gráfico da posição (0,0) até a posição (6,250).
import matplotlib.pyplot as plt
pontos_x = [0, 6]
pontos_y = [0, 250]
plt.plot(pontos_x, pontos_y)
plt.show()
Plotagem é o ato, processo ou efeito de plotar, localizar, situar. Na informática, é a produção da imagem de um gráfico a partir de dados.
A função plot() do Pyplot é usada para desenhar pontos e marcadores no diagrama de um gráfico, desenhando por padrão linhas ponto a ponto.
A função recebe parâmetros que especificam o aspecto dos pontos no diagrama.
O primeiro parâmetro é uma matriz contendo os pontos no eixo x.
O segundo parâmetro é uma matriz contendo os pontos no eixo y.
O Matplotlib pode receber como fonte de dados: listas nativas do Python(list); matrizes do Numpy (ndarray); séries (Series) e dataframes (DataFrame) do Pandas; entre outras.
Exemplo: desenhe uma linha em um diagrama da posição (1, 3) para a posição (8, 10) usando a função plot() e os parâmetros com os pontos inicial e final nas listas [1, 8] e [3, 10].
import matplotlib.pyplot as plt
#
pontos_x = [1, 8]
pontos_y = [3, 10]
#
plt.plot(pontos_x, pontos_y)
#
plt.show()
Exemplo: desenhe uma linha em um diagrama, usando a função plot(), da posição de x de 0 a len(y)-1, como ocorre por padrão quando apenas y é informado.
import matplotlib.pyplot as plt
y=[0,3,0,5,0,7,0]
plt.plot(y)
plt.show()
Além do Matplotlib, que já explicamos como instalar e importar, o Python oferece várias bibliotecas para o gerenciamento e visualização de dados com gráficos.
Algumas das mais populares utilizadas em nossos exemplos são:
A instalação dos pacotes é realizada com o pip> no prompt de comandos do SO:
A utilização dos pacotes é realizada com a instrução import:
Instale estes pacotes, pois são importantes para a realização da ciência de dados usando o Python com matemática e estatística.