Selecionando Apenas Colunas Numéricas no Python + Listando Todas as Colunas de um Dataframe (Pandas)

Recentemente fui analisar várias colunas de um dataframe no Python, mas as funções que estava utilizando eram todas numéricas. Ou seja, as colunas que não eram numéricas estavam atrapalhando meu código. Para resolver este problema, descobri que era possível selecionar somente as colunas numéricas no Python com uma função bem simples:

numerics = ['int16', 'int32', 'int64', 'float16', 'float32', 'float64']
df_numeric = df.select_dtypes(include=numerics)

Veja o que foi feito, primeiro declaramos quais os tipos de variáveis que queremos no nosso dataframe, na sequência, utilizamos a função select_dtypes() para filtrar somente os tipos de variáveis que correspondem ao tipo que declaramos. Com isso, temos uma nova tabela somente com os tipos de variáveis que queremos.

Se você quiser listar todas as variáveis que foram selecionadas, você pode utilizar o comando abaixo:

list(df_numeric.columns.values)

O comando é bem intuitivo, você está listando todas as variáveis (i.e., todas as colunas) do seu dataframe.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *