Faxina de dados

8 de maio a 22 de maio, 3 sábados, das 9h00 às 13h00

3 aulas, 12 horas de curso

Online

R$400,00




Ao se inscrever no curso, você declara estar de acordo com os nossos Termos de uso.

Conheça o curso

O R é uma linguagem de programação criada para a Ciência de Dados. Ela é uma das principais ferramentas utilizadas para manipulação, visualização e modelagem de dados, além de auxiliar na divulgação dos resultados com a criação de relatórios, apresentações e dashboards. O R conta com uma comunidade super ativa, que desenvolve novas funcionalidades em ritmo acelerado, deixando a linguagem sempre atualizada com as metodologias mais recentes.

A prática demonstra que entre 60% e 80% do trabalho da pessoa que trabalha com ciência de dados é voltada à leitura e arrumação de bases de dados. Então por que não discutir esse assunto com seriedade?

O objetivo deste curso é mostrar, através de diversos exemplos práticos, o incrível arsenal de ferramentas que o R nos proporciona para fazer a faxina de dados. Do ponto de vista teórico, vamos estudar sobre o que é uma base arrumada. Também vamos mostrar melhores práticas na estruturação de um projeto de faxina de dados, focando na reprodutibilidade e facilidade de compartilhar o trabalho realizado. Do ponto de vista prático, teremos muitos e muitos cases com arrumação de dados. O curso partirá de exemplos mais simples, como empilhar diversas bases de dados, até exemplos mais complexos, envolvendo rotinas de correção e validação de dados.

Você sairá deste curso apta(o) a:
  • Organizar um projeto de faxina de dados
  • Identificar o objetivo de um trabalho de faxina
  • Escrever rotinas para detecção de inconsistências nos dados
  • Definir as melhores práticas para nomear colunas
  • Escrever scripts avançados com o {tidyverse}


Conteúdo

  • O que são bases bagunças e arrumadas?
  • Organizando projetos de faxina de dados
  • Resolvendo problemas de importação
  • Melhores práticas para organização das colunas
  • Identificação de inconsistências nos dados
dplyr

Porque a maior parte do trabalho é manipulação de dados.

stringr

Regendo os seus textos.

lubridate

Está na hora de aprender a manipular datas.

purrr

Porque cada vez que você usa um for, um gatinho morre.

devtools

Somos todos desenvolvedores!

readr

Seus dados dentro do R!

usethis

Tarefas rotineiras em funções de R.

janitor

Arrume a bagunça da sua base de dados.


Professores

Bacharel e mestrando em Estatística pelo IME-USP. Diretor-técnico na Associação Brasileira de Jurimetria. Usa R para tudo, mas tem interesse especial em web scraping, visualização de dados e modelagem bayesiana.


Fernando Correa
    
  

Faxineiro de dados. Doutorando em Estatística pelo IME-USP. Secretário-geral da Associação Brasileira de Jurimetria (ABJ). Conselheiro do CONFE. Sócio da Terranova Consultoria. Trabalha com web scraping, arrumação de dados, construção de modelos preditivos, APIs, pacotes em R e dashboards em Shiny.


Julio Trecenti
    


Como será o curso?

  • Aulas online, em tempo real, com um(a) professor(a) e um(a) monitor(a).
  • Diversos exercícios “para casa” para praticar e tirar dúvidas.
  • Projeto de análise de dados para aplicar o conteúdo aprendido.
  • Certificado ao final do curso (sujeito à entrega de atividades solicitadas pelos professores).
  • Gravação das aulas disponíveis por pelo menos 1 ano.


Pré-requisitos


O que eu preciso ter?

  • Um notebook com acesso a internet e permissão para instalar novos programas;

  • Uma conta de e-mail Google para acessar o Google Classroom;

  • Uma conta no Github.

  • Últimas versões do R e do RStudio instaladas 😻.

Inscreva-se agora para embarcar nessa nova jornada pelo universo da Ciência de Dados!