Marcando o Tempo de Execução no Python

Para quem tem um script muito longo, ou está tentando melhorar um código, marcar o tempo de execução é essencial. Assim, você consegue prever quanto tempo um processo vai levar, ou se o comando A foi mais rápido que o comando B. Sendo assim, segue uma forma bem fácil de calcular o tempo de execução do seu código em Python: Continuar a ler “Marcando o Tempo de Execução no Python”

Obter os Nomes das Colunas no Python (Pandas)

Coisa simples, post rapidinho, somente para ensinar como obter os nomes das colunas. Isso pode servir para usar como input em outras funções, pode servir para melhor documentar o trabalho, para identificar o que será utilizado, dentre outras coisas. Vamos lá! Continuar a ler “Obter os Nomes das Colunas no Python (Pandas)”

Exportar Tabela em Python

Recentemente, tive que fazer um trabalho que envolvia montar várias tabelas e exportá-las para arquivos no formato CSV, pois eles serviriam de input para uma outra tarefa. Ao invés de usar o DataGrip, utilizei o SQL Alchemy para rodar os scripts em Python. A única coisa nova para mim, era exportação em CSV. Como sempre, era bem simples. Continuar a ler “Exportar Tabela em Python”

Mostrar Vários Outputs de uma Mesma Célula no Jupyter Notebook

Boa parte dos cientistas de dados estão trabalhando com o Jupyter Notebook. É um ambiente bem intuitivo, fácil de utilizar e bom para a construção de relatórios. Uma coisa besta mas que pode ser útil, é obter o resultado de várias linhas de código de uma mesma célula. Normalmente, se você jogar vários comandos, somente o último será exibido. Bom, não mais! Continuar a ler “Mostrar Vários Outputs de uma Mesma Célula no Jupyter Notebook”

Teste seus Conhecimentos em Data Science!

Quase que semanalmente, tenho feito alguns quizzes no twitter do EstatSite – você pode seguir indo em @EstatSite – sobre ciência de dados. As perguntas variam e vão desde questões sobre interpretação de gráficos até premissas utilizadas em modelos bastante comuns. Veja uns exemplos: Continuar a ler “Teste seus Conhecimentos em Data Science!”

Gráficos em Python Usando Pyplot e Seaborn

É possível fazer excelentes análises exploratórias no Python. Na última live que fiz no meu canal da Twitch, www.twitch.tv/yukiolive, mostrei algumas funcionalidades do Matplotlib e Seaborn. Como fazer gráficos de dispersão, de barras, como alterar os eixos, alterar o tamanho da figura utilizando plt.figure(), alterar o título (incluindo o tamanho e cor da fonte), dentre outras tantas coisas. Caso você não tenha assistido a live, fica o convite. E se você tiver interesse em olhar o material – que eu acredito estar bem auto-explicativo – você pode acessar meu github no link abaixo e estudar tudo o que foi feito. Além de poder explorar algumas bases interessantes! Continuar a ler “Gráficos em Python Usando Pyplot e Seaborn”

Erro na Leitura do CSV no Pandas (Python)

Muitos já viram o seguinte erro ao importar um arquivo csv no pandas:

ParserError: Error tokenizing data. C error: Expected 44 fields in line 66, saw 46

Ao que tudo indica, o Python esperava encontrar 44 campos na linha 66 e encontrou 46. Isso pode ter várias causas, mas uma das mais comuns é o arquivo ter um separador como a vírgula ou ponto-e-vírgula e algum campo também ter esse separador. Mas como resolver isso? Continuar a ler “Erro na Leitura do CSV no Pandas (Python)”

Detectando Outliers pelo Desvio Padrão no Python

Detectar outliers é necessário em qualquer análise. Não importa se você pretende excluí-los ou mantê-los, você precisa saber quem são eles. Um dos métodos mais comuns e fáceis é através do desvio padrão. Uma rule of thumb comumente utilizada é: se o indivíduo/ponto estiver a mais de 3 desvios padrões da média, é um outlier. No Python, podemos localizar esses pontos através do código abaixo. Teremos aí df como sendo nosso datarame e coluna_1 como sendo a coluna analisada: Continuar a ler “Detectando Outliers pelo Desvio Padrão no Python”

Python: Como Saber se um Arquivo se Encontra no Diretório

Em qualquer automatização, pode ser interessante você verificar se todos os arquivos que você precisa se encontram no diretório correspondente. Abaixo, temos um script em python para fazer exatamente isso. O que o código abaixo faz é: (1) cria uma lista vazia chamada todos_arquivos; (2) percorre todo o diretório e anexa o nome dos arquivos encontrados na lista todos_arquivos: Continuar a ler “Python: Como Saber se um Arquivo se Encontra no Diretório”

Como fazer um PROCV no Python

Já expliquei essa função outras vezes, mas talvez chamá-la de PROCV (ou VLOOKUP para quem usa Excel em inglês) ajuda as pessoas a compreendê-la. O post de hoje é dedicado a ensinar como fazer a famosa função PROCV do Excel no Python.  Continuar a ler “Como fazer um PROCV no Python”