Análogo ao que foi feito no post Machine Learning do Zero no Python, teremos agora no blog um tutorial bem tranquilo, do ZERO, para quem quer aprender Machine Learning / Ciência de Dados, utilizando R. Não fique com medo por ser um post mais extenso, você pode fazer um pouco cada dia durante um certo período de tempo, caso sinta que está pesado demais. Abaixo, você vai aprender a tratar os dados, fazer filtros, localizar valores nulos, criar gráficos e até conhecer alguns modelos. Então bora aprender! Continuar a ler “Machine Learning do Zero no R”
Etiqueta: ciência de dados
Machine Learning do Zero no Python
Recentemente, estive na Python Brasil 2019. Um evento muito legal, falei um pouco sobre ele no Twitter do EstatSite (veja a thread aqui), e, inclusive, estou devendo um post aqui no blog. Acabei participando de um tutorial chamado “Machine Learning do Zero”, dado pelo Tarsis Azevedo – o cara é fera, recomendo que acompanhem o trabalho dele pelo Twitter ou Github, @tarsisazevedo. Aqui, vai o código feito em sala de aula, com algumas alterações e comentários que inclui porque achei relevante – outras porque achei que poderia facilitar para os mais novos
Atualização: Vocês agora podem visitar o post Regressão Linear no Python para aprender mais sobre regressão linear utilizando Python! Continuar a ler “Machine Learning do Zero no Python”
Tutorial: Limpeza e Análise de Dados com Python
Hoje vamos aprender algumas coisas que podem ser feitas quando se trabalha com dataframes no Python. Como filtrar uma base? Como converter textos para números? Como extrair um valor de moeda no formato texto para o formato numérico? Como obter as estatísticas descritivas? Como criar novas colunas? Como traçar um histograma? Como localizar valores nulos e preenchê-los com a média da coluna? Tudo isso e muito mais no post abaixo! Continuar a ler “Tutorial: Limpeza e Análise de Dados com Python”
Funções Lambda em Python
Já expliquei como construir uma função em Python no post Construindo Funções em Python. No entanto, Python tem uma função que eu desconhecia até pouco tempo e que tem seu valor, principalmente pela praticidade. Esta nova função, que eu vou explicar neste post, é a chamada função lambda. Continuar a ler “Funções Lambda em Python”
Criando Sequências no Python
Uma coisa geralmente é útil em diversos momentos é criar uma sequência de números. Seja esta sequência somente um índice ou uma sequência com alguma lógica, como uma progressão aritmética ou geométrica, é raro você passar por uma linguagem sem utilizá-las. No Python, isto não é diferente. Por isso, vamos ver alguns exemplos de como construir sequências. Continuar a ler “Criando Sequências no Python”
Python: Tipos de Variáveis e Listas
Como todas as linguagens, Python tem seus tipos de variáveis. A maioria já é conhecida das pessoas (string, numérica, etc.), mas há algumas novidades em termos de listas. Neste post, veremos como identificar o tipo da variável, algumas manipulações simples que podem ser feitas com cada tipo e os diferentes tipos de listas. Continuar a ler “Python: Tipos de Variáveis e Listas”
Uma Brevíssima Introdução ao Anaconda e o Jupyter Notebook
Conforme falei em Primeiros passos em Python, uma opção perfeita para iniciantes no Python é o Anaconda, que possui já integrado nele o Jupyter Notebook e algumas outras ferramentas. Como a plataforma pode ser nova para alguns, vou explicar um pouco sobre como fazer uso dela para programar em Python. É uma brevíssima introdução, bem prática, para que você passe logo pela parte chata e comece a programar. Continuar a ler “Uma Brevíssima Introdução ao Anaconda e o Jupyter Notebook”
Equivalente ao Proc Sql Group By no R
Suponha que você tenha uma tabela analítica com as informações de compras dos seus clientes. Cada linha da tabela equivale a uma compra diferente que o cliente fez. O que você quer é saber o valor médio das compras de cada cliente. Como você conseguiria fazer isso no R? Continuar a ler “Equivalente ao Proc Sql Group By no R”
Diferença entre duas datas no SAS (em dias, meses ou anos)
Calcular a diferença entre duas datas no SAS é simples, basta subtrair uma data pela outra. Porém, se você quiser fazer a diferença em meses, anos, semanas ou alguma unidade do tipo, há duas escolhas: (1) realizar a subtração e depois dividir o valor pelo número de dias correspondentes ao período (ex.: dividir por 30 no caso de mês) ou (2) utilizar a função intck(). É desta segunda que vou falar neste post. Continuar a ler “Diferença entre duas datas no SAS (em dias, meses ou anos)”
Probabilidade (I): Introdução e Conceitos Básicos
A probabilidade é o estudo da chance de ocorrência de um determinado evento. Quando jogamos um dado e perguntamos “qual a probabilidade de sair o número 3?”, queremos saber qual a chance de sair 3. Queremos saber o que é esperado deste evento, que é jogar um dado. A forma que temos de quantificar uma probabilidade é um número que vai de 0 até 1. Claro que, muito provavelmente, você prefira expressar a probabilidade em percentual, o que é a mesma coisa. Quando temos 100% de chance de que o evento ocorra, a probabilidade será 1, já quando temos 50%, a chance é 0,5. Continuar a ler “Probabilidade (I): Introdução e Conceitos Básicos”