Tem muita gente que prefere programar com a tela preta. Seja porque acredita que isso gera algum ganho em produtividade, seja por questão estética mesmo, muitas pessoas preferem programar dessa forma. No Jupyter Notebook, um dos ambientes mais utilizados em Python, fazer essa troca não é tão intuitiva. Mas também não é difícil. Veja abaixo os passos que você deve seguir para fazer isso! Continuar a ler “Jupyter Notebook com o Fundo Preto”
Etiqueta: python
Marcando o Tempo de Execução no Python
Para quem tem um script muito longo, ou está tentando melhorar um código, marcar o tempo de execução é essencial. Assim, você consegue prever quanto tempo um processo vai levar, ou se o comando A foi mais rápido que o comando B. Sendo assim, segue uma forma bem fácil de calcular o tempo de execução do seu código em Python: Continuar a ler “Marcando o Tempo de Execução no Python”
Obter os Nomes das Colunas no Python (Pandas)
Coisa simples, post rapidinho, somente para ensinar como obter os nomes das colunas. Isso pode servir para usar como input em outras funções, pode servir para melhor documentar o trabalho, para identificar o que será utilizado, dentre outras coisas. Vamos lá! Continuar a ler “Obter os Nomes das Colunas no Python (Pandas)”
Exportar Tabela em Python
Recentemente, tive que fazer um trabalho que envolvia montar várias tabelas e exportá-las para arquivos no formato CSV, pois eles serviriam de input para uma outra tarefa. Ao invés de usar o DataGrip, utilizei o SQL Alchemy para rodar os scripts em Python. A única coisa nova para mim, era exportação em CSV. Como sempre, era bem simples. Continuar a ler “Exportar Tabela em Python”
Mostrar Vários Outputs de uma Mesma Célula no Jupyter Notebook
Boa parte dos cientistas de dados estão trabalhando com o Jupyter Notebook. É um ambiente bem intuitivo, fácil de utilizar e bom para a construção de relatórios. Uma coisa besta mas que pode ser útil, é obter o resultado de várias linhas de código de uma mesma célula. Normalmente, se você jogar vários comandos, somente o último será exibido. Bom, não mais! Continuar a ler “Mostrar Vários Outputs de uma Mesma Célula no Jupyter Notebook”
Gráficos em Python Usando Pyplot e Seaborn
É possível fazer excelentes análises exploratórias no Python. Na última live que fiz no meu canal da Twitch, www.twitch.tv/yukiolive, mostrei algumas funcionalidades do Matplotlib e Seaborn. Como fazer gráficos de dispersão, de barras, como alterar os eixos, alterar o tamanho da figura utilizando plt.figure(), alterar o título (incluindo o tamanho e cor da fonte), dentre outras tantas coisas. Caso você não tenha assistido a live, fica o convite. E se você tiver interesse em olhar o material – que eu acredito estar bem auto-explicativo – você pode acessar meu github no link abaixo e estudar tudo o que foi feito. Além de poder explorar algumas bases interessantes! Continuar a ler “Gráficos em Python Usando Pyplot e Seaborn”
Erro na Leitura do CSV no Pandas (Python)
Muitos já viram o seguinte erro ao importar um arquivo csv no pandas:
ParserError: Error tokenizing data. C error: Expected 44 fields in line 66, saw 46
Ao que tudo indica, o Python esperava encontrar 44 campos na linha 66 e encontrou 46. Isso pode ter várias causas, mas uma das mais comuns é o arquivo ter um separador como a vírgula ou ponto-e-vírgula e algum campo também ter esse separador. Mas como resolver isso? Continuar a ler “Erro na Leitura do CSV no Pandas (Python)”
Gráficos com Dois Eixos-Y no Python
Ok, eu acabei de escrever um artigo falando para que você não utilize gráficos com dois eixos-y. Esse uso é desonesto, leva o leitor a interpretar de forma equivocada os dados. Se quiser entender melhor, leia o post O Problema com Dois Eixos-Y. Mas vamos supor que seu chefe mande você fazer isso, ele não se importa com esses problemas. Eu vou te deixar na mão? Claro que não. Abaixo, você encontra os códigos que utilizei para gerar os gráficos do post anterior. Continuar a ler “Gráficos com Dois Eixos-Y no Python”
Detectando Outliers pelo Desvio Padrão no Python
Detectar outliers é necessário em qualquer análise. Não importa se você pretende excluí-los ou mantê-los, você precisa saber quem são eles. Um dos métodos mais comuns e fáceis é através do desvio padrão. Uma rule of thumb comumente utilizada é: se o indivíduo/ponto estiver a mais de 3 desvios padrões da média, é um outlier. No Python, podemos localizar esses pontos através do código abaixo. Teremos aí df como sendo nosso datarame e coluna_1 como sendo a coluna analisada: Continuar a ler “Detectando Outliers pelo Desvio Padrão no Python”
Python: Como Saber se um Arquivo se Encontra no Diretório
Em qualquer automatização, pode ser interessante você verificar se todos os arquivos que você precisa se encontram no diretório correspondente. Abaixo, temos um script em python para fazer exatamente isso. O que o código abaixo faz é: (1) cria uma lista vazia chamada todos_arquivos; (2) percorre todo o diretório e anexa o nome dos arquivos encontrados na lista todos_arquivos: Continuar a ler “Python: Como Saber se um Arquivo se Encontra no Diretório”