Conheça o curso
O R é uma linguagem de programação criada para a Ciência de Dados. Ela é uma das principais ferramentas utilizadas para manipulação, visualização e modelagem de dados, além de auxiliar na divulgação dos resultados com a criação de relatórios, apresentações e dashboards. O R conta com uma comunidade super ativa, que desenvolve novas funcionalidades em ritmo acelerado, deixando a linguagem sempre atualizada com as metodologias mais recentes.
A prática demonstra que entre 60% e 80% do trabalho da pessoa que trabalha com ciência de dados é voltada à leitura e arrumação de bases de dados. Então por que não discutir esse assunto com seriedade?
O objetivo deste curso é mostrar, através de diversos exemplos práticos, o incrível arsenal de ferramentas que o R nos proporciona para fazer a faxina de dados. Do ponto de vista teórico, vamos estudar sobre o que é uma base arrumada. Também vamos mostrar melhores práticas na estruturação de um projeto de faxina de dados, focando na reprodutibilidade e facilidade de compartilhar o trabalho realizado. Do ponto de vista prático, teremos muitos e muitos cases com arrumação de dados. O curso partirá de exemplos mais simples, como empilhar diversas bases de dados, até exemplos mais complexos, envolvendo rotinas de correção e validação de dados.
Você sairá deste curso apta(o) a:
- Organizar um projeto de faxina de dados
- Identificar o objetivo de um trabalho de faxina
- Escrever rotinas para detecção de inconsistências nos dados
- Definir as melhores práticas para nomear colunas
- Escrever scripts avançados com o
{tidyverse}
Conteúdo
- O que são bases bagunças e arrumadas?
- Organizando projetos de faxina de dados
- Resolvendo problemas de importação
- Melhores práticas para organização das colunas
- Identificação de inconsistências nos dados

Porque a maior parte do trabalho é manipulação de dados.

Regendo os seus textos.

Está na hora de aprender a manipular datas.

Porque cada vez que você usa um for, um gatinho morre.

Somos todos desenvolvedores!

Seus dados dentro do R!

Tarefas rotineiras em funções de R.

Arrume a bagunça da sua base de dados.
Professores

Bacharel e mestrando em Estatística pelo IME-USP. Diretor-técnico na Associação Brasileira de Jurimetria. Usa R para tudo, mas tem interesse especial em web scraping, visualização de dados e modelagem bayesiana.
Fernando Correa

Faxineiro de dados. Doutorando em Estatística pelo IME-USP. Secretário-geral da Associação Brasileira de Jurimetria (ABJ). Conselheiro do CONFE. Sócio da Terranova Consultoria. Trabalha com web scraping, arrumação de dados, construção de modelos preditivos, APIs, pacotes em R e dashboards em Shiny.
Julio Trecenti
Como será o curso?
- Aulas online, em tempo real, com um(a) professor(a) e um(a) monitor(a).
- Diversos exercícios “para casa” para praticar e tirar dúvidas.
- Projeto de análise de dados para aplicar o conteúdo aprendido.
- Certificado ao final do curso (sujeito à entrega de atividades solicitadas pelos professores).
- Gravação das aulas disponíveis por pelo menos 1 ano.
Pré-requisitos
O conteúdo do curso R para Ciência de dados I
O conteúdo do curso R para Ciência de dados II
O que eu preciso ter?
Um notebook com acesso a internet e permissão para instalar novos programas;
Uma conta de e-mail Google para acessar o Google Classroom;
Uma conta no Github.
Inscreva-se agora para embarcar nessa nova jornada pelo universo da Ciência de Dados!