Introdução ao Text Mining com Python

Ainda não fiz nenhum post sobre text mining neste blog, o que é um pecado. Analisar textos, agora que muita informação está no Twitter, Facebook, comentários, discussões online, dentre tantas outras coisas, é essencial. Por isso, hoje vou fazer um breve post, no melhor estilo github, deixando somente o código e os comentários. Penso que é tudo bem auto-explicativo aqui, mas fiquem à vontade de me questionar nos comentários ou em qualquer outro lugar, caso tenham dúvidas com relação a algum trecho. Continuar a ler “Introdução ao Text Mining com Python”

Join / Merge no Python (Usando Pandas)

Assim como aprendemos no SQL, ou qualquer linguagem para manipulação de bases de dados, como unir bases de dados de diferentes maneiras, o Pandas nos permite fazer estas tratativas no Python. Abaixo, vamos aprender como fazer as uniões de tabelas e algumas táticas que podem facilitar sua vida. Continuar a ler “Join / Merge no Python (Usando Pandas)”

Tabela Dinâmica no Python

Todo mundo já se complicou tentando fazer uma tabela dinâmica (pivot table) fora do Excel. No Python, você não precisa criar uma função ou fazer algum tipo de manipulação com a tabela para chegar numa visão semelhante ao que fazemos nas tabelas dinâmicas do Excel. Vamos entender então como utilizar a função pivot_table – se você estiver iniciando e não sabe ainda o que é uma tabela dinâmica, recomendo que vá ao Youtube, faça uma pesquisa rápida e volte em seguida. Continuar a ler “Tabela Dinâmica no Python”

Tutorial: Strings em Python

Trabalhar com variáveis texto não é a coisa mais difícil do mundo, mas nem sempre é trivial. Como contar a quantidade de caracteres (i.e. o comprimento) de uma variável? Como converter uma variável minúscula para maiúscula? Como pegar um trecho (~substring) de uma variável texto? Como concatenar dois campos e criar uma nova coluna com base neles? Tudo isso é essencial para a sobrevivência de um cientista de dados. Neste post, vamos conhecer alguns comandos essenciais para quando se trabalha com variáveis strings no Python. Continuar a ler “Tutorial: Strings em Python”

Tutorial: Tratando sua Tabela no Python (com Pandas)

Este Tutorial deveria se chamar “Selecionando e Filtrando Elementos em um Dataframe no Python”, entretanto, para não confundir ninguém, exclui o termo “Dataframe”. De maneira formal, Dataframe é um objeto formado por séries bidimensionais. De forma esdrúxula, é o que normalmente lemos como uma tabela. Neste post, trabalhando com a biblioteca Pandas, vou mostrar como localizar elementos, fazer filtros, excluir colunas, ordenar os dados, dentre outras tarefas que realizamos em Dataframes. Continuar a ler “Tutorial: Tratando sua Tabela no Python (com Pandas)”

Inserindo Título/Notas no seu Jupyter Notebook

Já dei uma breve introdução ao Jupyter Notebook no post Uma Brevíssima Introdução ao Anaconda e o Jupyter Notebook. Se antes eu achava que o Rodeo seria meu preferido para programar em Python, agora não vejo chance nenhuma de trocar o Jupyter Notebook. Uma das coisas mais interessantes dessa aplicação, e que será o tema deste curto post, é que você consegue acompanhar facilmente todo o histórico de seu código e, mais ainda, transformar numa espécie de apresentação ou caderno mesmo. Continuar a ler “Inserindo Título/Notas no seu Jupyter Notebook”

Funções Lambda em Python

Já expliquei como construir uma função em Python no post Construindo Funções em Python. No entanto, Python tem uma função que eu desconhecia até pouco tempo e que tem seu valor, principalmente pela praticidade. Esta nova função, que eu vou explicar neste post, é a chamada função lambdaContinuar a ler “Funções Lambda em Python”

Criando Sequências no Python

Uma coisa geralmente é útil em diversos momentos é criar uma sequência de números. Seja esta sequência somente um índice ou uma sequência com alguma lógica, como uma progressão aritmética ou geométrica, é raro você passar por uma linguagem sem utilizá-las. No Python, isto não é diferente. Por isso, vamos ver alguns exemplos de como construir sequências. Continuar a ler “Criando Sequências no Python”

Python: Tipos de Variáveis e Listas

Como todas as linguagens, Python tem seus tipos de variáveis. A maioria já é conhecida das pessoas (string, numérica, etc.), mas há algumas novidades em termos de listas. Neste post, veremos como identificar o tipo da variável, algumas manipulações simples que podem ser feitas com cada tipo e os diferentes tipos de listas. Continuar a ler “Python: Tipos de Variáveis e Listas”

Uma Brevíssima Introdução ao Anaconda e o Jupyter Notebook

Conforme falei em Primeiros passos em Python, uma opção perfeita para iniciantes no Python é o Anaconda, que possui já integrado nele o Jupyter Notebook e algumas outras ferramentas. Como a plataforma pode ser nova para alguns, vou explicar um pouco sobre como fazer uso dela para programar em Python. É uma brevíssima introdução, bem prática, para que você passe logo pela parte chata e comece a programar. Continuar a ler “Uma Brevíssima Introdução ao Anaconda e o Jupyter Notebook”