R para Ciência de Dados II

5 de abril a 22 de abril, às segundas e quintas, das 19h00 às 22h00

6 aulas, 18 horas de curso

Online

R$550,00




Ao se inscrever no curso, você declara estar de acordo com os nossos Termos de uso.

Conheça o curso

O R é uma linguagem de programação criada para a Ciência de Dados. Ela é uma das principais ferramentas utilizadas para manipulação, visualização e modelagem de dados, além de auxiliar na divulgação dos resultados com a criação de relatórios, apresentações e dashboards. O R conta com uma comunidade super ativa, que desenvolve novas funcionalidades em ritmo acelerado, deixando a linguagem sempre atualizada com as metodologias mais recentes.

O objetivo deste curso é aprofundar os conceitos essenciais de programação em R para Ciência de Dados. A partir de problemas reais de análise de dados, apresentaremos técnicas intermediárias e avançadas de manipulação de dados, incluindo textos e datas, e conceitos de programação funcional.

Você sairá deste curso apta(o) a:
  • organizar seus projetos de análise de dados para gerar agilidade e eficiência;
  • fazer manipulações de dados mais complexas com os pacotes dplyr e tidyr, como pivotagem e diversos tipos de joins;
  • manipular texto e datas com os pacotes stringr e lubridate;
  • substituir loopings em for e while pelas maravilhosas funções do pacote purrr.


Conteúdo

  • Organização de projetos
    • Por que não usar .RData e .Rhistory
    • Git e Github
    • Funções e dependências
  • Manipulação de dados
    • {dplyr} 1.0: across(), where()
    • Mais verbos de manipulação: o pacote tidyr
    • Pivotagem
    • Manipulação de textos com o pacote {stringr}
    • Manipulação de datas com o pacote {lubridate}
    • Manipulação de fatores com o pacote {forcats}
  • Programação funcional
    • Listas e list-columns
    • Introdução ao pacote {purrr}
    • Substituindo for e while pelas funções map_()
    • Introdução a non-standard evaluation e ao operador {{ }}
dplyr

Porque a maior parte do trabalho é manipulação de dados.

stringr

Regendo os seus textos.

lubridate

Está na hora de aprender a manipular datas.

purrr

Porque cada vez que você usa um for, um gatinho morre.

tidyverse

A filosofia tidy.

usethis

Tarefas rotineiras em funções de R.


Professores

Mestrando em Ciência da Computação no IME-USP e cientista de dados na Terranova Consultoria. Programador desde os 15 anos, começou a se apaixonar pelo R em 2016 e agora não fala em outra coisa. Metido a designer, maníaco da organização e metade texano


Caio Lente
    
  

Doutor em Estatística pelo IME-USP com projeto depesquisa na área de poluição do ar. Trabalhando diaramente com análise de dados e programação em R. Escritor nas horas vagas.


William Amorim
    


Como será o curso?

  • Aulas online, em tempo real, com um(a) professor(a) e um(a) monitor(a).
  • Diversos exercícios “para casa” para praticar e tirar dúvidas.
  • Projeto de análise de dados para aplicar o conteúdo aprendido.
  • Certificado ao final do curso (sujeito à entrega de atividades solicitadas pelos professores).
  • Gravação das aulas disponíveis por pelo menos 1 ano.


Pré-requisitos


O que eu preciso ter?

  • Um notebook com acesso a internet e permissão para instalar novos programas;

  • Uma conta de e-mail Google para acessar o Google Classroom;

  • Uma conta no Github;

  • Últimas versões do R e do RStudio instaladas 😻.

Inscreva-se agora para embarcar nessa nova jornada pelo universo da Ciência de Dados!