Análise de texto usando Python

A análise de texto (~text mining) consiste no processo de obter informações através de dados no formato de um texto. Por se tratar de dados não-estruturados, a limpeza e tratativa é parte relevante e pouco trivial do processo. Falei brevemente de text mining no post Introdução ao Text Mining com Python. Hoje, volto ao tema utilizando uma biblioteca que me deixou bastante surpreso com seu poder de análise: a texthero! Continuar a ler “Análise de texto usando Python”

Introdução ao Text Mining com Python

Ainda não fiz nenhum post sobre text mining neste blog, o que é um pecado. Analisar textos, agora que muita informação está no Twitter, Facebook, comentários, discussões online, dentre tantas outras coisas, é essencial. Por isso, hoje vou fazer um breve post, no melhor estilo github, deixando somente o código e os comentários. Penso que é tudo bem auto-explicativo aqui, mas fiquem à vontade de me questionar nos comentários ou em qualquer outro lugar, caso tenham dúvidas com relação a algum trecho. Continuar a ler “Introdução ao Text Mining com Python”

Artigo utilizando modelos em painel e text mining

Escrevi um texto para o portal deviante falando sobre um dos artigos mais legais de economia que li no ano passado. Além do considerável impacto social do tema, me chamou a atenção ver a autora utilizar text mining – além de outras técnicas estatísticas, como modelos em painel. Fica aí o link do meu texto para quem se interessar: Igualdade de Gênero no Mundo Acadêmico. Nele faço referência ao artigo e também a um bom livro chamado “The Why Axis: Hidden Motives and the Undiscovered Economics”, que é de economia, mas uma boa leitura para qualquer um envolvido em análise de dados.

Leia também:
Diferenças em Diferenças (Diff-in-Diff)
Regressão Diff-In-Diff com Efeitos Fixos no R