Contar Valores Nulos (Missing) por Coluna no Python

Bom, o título é auto-explicativo: afinal de contas, como podemos saber a quantidade de valor nulos em cada coluna no Python (trabalhando com Dataframes no Pandas)? Continuar a ler “Contar Valores Nulos (Missing) por Coluna no Python”

Selecionando Apenas Colunas Numéricas no Python + Listando Todas as Colunas de um Dataframe (Pandas)

Recentemente fui analisar várias colunas de um dataframe no Python, mas as funções que estava utilizando eram todas numéricas. Ou seja, as colunas que não eram numéricas estavam atrapalhando meu código. Para resolver este problema, descobri que era possível selecionar somente as colunas numéricas no Python com uma função bem simples: Continuar a ler “Selecionando Apenas Colunas Numéricas no Python + Listando Todas as Colunas de um Dataframe (Pandas)”

Obter e Alterar o Working Directory no Python

Quando você trabalha no R, Python ou qualquer linguagem análoga, você está trabalhando os arquivos em algum diretório local. Quando você salvar o objeto de saída do seu código, ele será salvo neste diretório; quando você importar um arquivo escrevendo somente o nome do arquivo, ele só será importado se estiver neste diretório. Sendo assim, é importante saber em que diretório o software está trabalhando. Aqui, explico como obter o working directory no Python e como alterá-lo. Continuar a ler “Obter e Alterar o Working Directory no Python”

Gráficos com ou sem muitos detalhes?

Sempre tive um pé atrás com relação ao exagero em qualquer tipo de apresentação. Seja na minha dissertação de mestrado, que teve 33 páginas, ou nas apresentações no trabalho, onde evitava encher slides com muitas informações, preferia apresentar algo enxuto que focava no que importava. Por estes motivos, meus gráficos sempre foram os mais simples possíveis. Achava inclusive que encher de detalhes, legendas e outras anotações, iria tirar o foco do leitor. Mas o que diz a literatura sobre isso? Continuar a ler “Gráficos com ou sem muitos detalhes?”

Group By no Python + Group By com Base Filtrada

O termo group by é muito popular para quem trabalha com base de dados. Quando temos repetições para o elemento chave e queremos fazer um resumo, um agrupamento, é esse o comando a ser utilizado. Um exemplo clássico é quando você tem os dados dos gastos feitos por clientes de uma loja e sua base contém um gasto por linha. Para obter o total gasto por cada cliente, você irá recorrer ao group by. Continuar a ler “Group By no Python + Group By com Base Filtrada”

Maconha: A Porta de Entrada Para Outras Drogas?

A maconha é vista como a porta de entrada para drogas mais potentes pelos mais conservadores e receosos com o uso da substância. Ainda que este argumento tenha sido criado com a onda da proibição, junto com outros argumentos que já foram comprovados como sendo falaciosos, até hoje ele é utilizado e tido como uma verdade absoluta por muitos. O grande problema é que, assim como a vasta maioria dos argumentos utilizados por quem é a favor da proibição da droga, ele é comumente levantado sem nenhum tipo de dado científico. Continuar a ler “Maconha: A Porta de Entrada Para Outras Drogas?”

O Parque dos Ratos: O Vício Além dos Componentes Químicos

Como não escrevo mais para nenhum outro site, este texto teve que ser publicado aqui mesmo. Sei que não tem a ver com o EstatSite, mas é o jeito.

Drogas viciam, todo mundo sabe disso. O motivo parece óbvio, há alguns componentes químicos que agem sobre seu cérebro de forma a criar uma dependência. É assim com álcool, nicotina, maconha, cocaína e muitas outras substâncias conhecidas. Ao menos, é assim que o senso comum costuma tratar o vício. O que poucos sabem é que no caso das drogas, assim como em muitos outros temas, o senso comum não segue à risca o que a ciência diz. Há muito tempo, ainda que isso não seja muito falado, descobriu-se que o vício possui outras origens que vão além da química e elas estariam no ambiente em que o indivíduo faz parte. Continuar a ler “O Parque dos Ratos: O Vício Além dos Componentes Químicos”

Experimentos Controlados: Intenção-de-Tratar

Os experimentos aleatórios controlados, famosos RCTs (Randomized Controlled Trials), trazem consigo alguns problemas no que diz respeito aos indivíduos que fazem parte do estudo. Pense, por exemplo, num indivíduo que faz parte de um estudo com um novo remédio que deve ser tomado para baixar seu colesterol. É impossível para o cientista que está realizando o estudo saber se o paciente vai tomar ou não o remédio. É impossível também ele fazer com que o indivíduo não desapareça do nada. Para lidar com estes problemas, é comum adotamos a abordagem Intenção-de-Tratar (nome traduzido diretamente de Intention to Treat). Apenas para facilitar a escrita, chamaremos a abordagem de sua abreviação no inglês, ITT. Continuar a ler “Experimentos Controlados: Intenção-de-Tratar”

Qual amostra mais confiável, uma de 90% da população ou uma de 5%?

Lembra daquelas pesquisas eleitorais de Twitter ou qualquer outra plataforma falando: entre aqui e marque em quem você vai votar, vamos fazer uma amostra de X milhões de pessoas, mais confiável que as pesquisas atuais? Eu lembro bem, pois é sofrível para alguém que adora estatística ouvir isso. Se você está minimamente próximo da estatística na sua vida profissional ou acadêmica e ainda acredita que é uma amostra de 1 milhão de pessoas é mais confiável do que uma de 5 mil, se você é desses que não desconfia de pesquisas feitas na internet onde participa quem se dispõe a clicar e preencher as respostas, então aconselho a leitura de uma discussão de hoje que aconteceu no Twitter. Continuar a ler “Qual amostra mais confiável, uma de 90% da população ou uma de 5%?”

Comunidades Terapêuticas: A Chave para Vencer as Drogas?

Estava com este texto escrito desde abril, como não encontrei onde publicá-lo – na verdade, até achei que tivesse, mas o site para o qual eu mandei ainda não publicou – vai ser aqui mesmo. Sem revisões de terceiros mesmo, então peço desculpas se tiver algum erro de concordância, gramática ou algo assim (acho que não tem!).

A guerra às drogas já consumiu trilhões de dólares considerando somente os Estados Unidos [1]. Apesar deste gasto imenso, este mercado nunca esteve tão acessível, o que deixa claro que as medidas de repressão que boa parte dos países adotaram no passado fracassaram. Por este motivo, boa parte do mundo desenvolvido tem migrado para uma política de redução de danos, descriminalização e legalização, ao invés de repressão. O Brasil, no entanto, ao assinar a nova Política Nacional sobre Drogas (PNAD) [2], caminha mais uma vez na direção contrária do que recomendam os especialistas da área. Continuar a ler “Comunidades Terapêuticas: A Chave para Vencer as Drogas?”