O método corr() encontra relacionamentos entre as colunas, combinando as númericas duas a duas, até combinar todos os pares possíveis, calculando a relação entre as coluna em seu conjunto de dados.
Baixe o arquivo dados6.csv, utilizado nos exemplos.
Mostre a relação entre as colunas:
import pandas as pd
df = pd.read_csv('dados6.csv')
print("------ dados")
print(df.to_string())
print()
print("------ correlações")
print(df.corr())
Note que o métodos corr() considera apenas as colunas de valores numéricos.
O método corr() retorna uma tabela com linhas e colunas de números que representam o relacionamento entre duas colunas, em que quanto maior o valor, maior o relacionamento entre as colunas.
Uma boa correlação depende da aplicação, mas é seguro afirmar ser necessário um valor a partir de 0.6 (ou -0.6) para chamar de boa correlação.