Fazer um histograma no R é bem simples, basta utilizar o comando hist() com a variável que você quer investigar a distribuição. No entanto, um gráfico detalhado pode necessitar de mais detalhes, seja uma mudança na cor ou a apresentação das medidas de tendência central. Este post apresentará os detalhes que são possíveis de acrescentar no seu histograma utilizando o R.
Construindo Funções em Python
Uma das maiores vantagens para quem programa é poupar tempo. E uma das melhores formas de se poupar tempo é criando funções que realizem tarefas mais recorrentes. No Python, isso é feito utilizando o def + parâmetros (se houver) + dois pontos. Veja alguns exemplos de funções:
Funções em R
Não lembrava que já tinha feito um post sobre funções em R e acabei escrevendo mais este aqui (já aconteceu outras vezes rs). Como já estava pronto, não tinha motivos para deletar. Deixo aqui então um post que serve de complemento ao Funções no R.
Podcasts
Você pega trânsito no trabalho? Já cansou dos programas de rádio? Quer fazer algo mais produtivo com esse tempo? Que tal tentar um podcast?
Fiz uma pequena lista de programas falando sobre estatística:
Podcasts que falam sobre Estatística
PS.: Depois de ouvir os programas sobre estatística, dê uma chance a essa mídia. Recomendo o Scicast e o Dragões de Garagem para quem gosta de ciência!
Tutorial: Manipulação e Análise de Dados em R
Esse é um pequeno tutorial para quem não tem muita familiriadade com o R. O foco é entender o que o R é capaz de fazer, mas não deixar de fora as explicações estatísticas (ainda que sejam breves). Se você nunca abriu o R, recomendo que passe primeiro por Primeiros passos no R (Studio) e em seguida volte aqui. Hoje, vamos abordar um problema desde o entendimento dos dados até uma breve modelagem estatística. Espero que gostem!
Entendendo seus dados em Python
Quando você importa alguma tabela em ambientes como o R e o Python, diferente de um Excel que está escancarado na sua cara, é preciso ter um conhecimento mínimo de algumas funções para entender o que há na tabela. Por exemplo, o que está nas primeiras linhas, o que está nas últimas ou qual o tipo de cada elemento. Este post é para isso.
Como ter um modelo overfitted/sobreajustado?
Fez um modelo com preditores complexos e o treinou com poucos exemplos? Mudou a questão inicial para dar uma tunada nos indicadores?
Leia mais…
Cursos de Verão IME-USP
Já saiu a lista com os cursos de verão do Instituto de Matemática e Estatística da Universidade de São Paulo. Recomendo para quem quer aprender sobre estatística (ou outra disciplina bacana relacionada a matemática):
–> Lista de Cursos <–
Já sabe programar em Python?
Todo cientista de dados vai ter que aprender a utilizar esta ferramenta, por isso tem um tutorial bem detalhado para quem quiser tentar: Primeiros passos em Python
Charada de SQL
Esse é um tipo de “pegadinha” comum em entrevistas e que mesmo no dia a dia confunde algumas pessoas na hora de tratar os dados. Seja para surpreender o entrevistador ou para resolver rápido os problemas, você precisa ter a resposta na ponta da língua.