R para Ciência de Dados II

18 de agosto a 3 de setembro, às terças e quintas, das 19h00 às 22h00

6 aulas, 18 horas de curso

Online

R$500,00


Conheça o curso

O R é uma linguagem de programação criada para a Ciência de Dados. Ela é uma das principais ferramentas utilizadas para manipulação, visualização e modelagem de dados, além de auxiliar na divulgação dos resultados com a criação de relatórios, apresentações e dashboards. O R conta com uma comunidade super ativa, que desenvolve novas funcionalidades em ritmo acelerado, deixando a linguagem sempre atualizada com as metodologias mais recentes.

O objetivo deste curso é aprofundar os conceitos essenciais de programação em R para Ciência de Dados. A partir de problemas reais de análise de dados, apresentaremos técnicas intermediárias e avançadas de manipulação de dados, construção de gráficos e conceitos de programação funcional. Para motivar ainda mais, faremos ao final do curso uma introdução ao Shiny, possibilitando a criação de dashboards interativos que podem ser disponibizados online.

Você sairá deste curso apta(o) a:
  • organizar seus projetos de análise de dados para gerar agilidade e eficiência;
  • fazer manipulações de dados mais complexas com os pacotes dplyr e tidyr, como pivotagem e diversos tipos de joins;
  • manipular texto e datas com os pacotes stringr e lubridate;
  • substituir loopings em for e while pelas maravilhosas funções do pacote purrr;
  • costruir e disponibilizar online um aplicativo interativo para compartilhar resultados da sua análise.


Conteúdo

  • Organização de projetos
    • Por que não usar .RData e .Rhistory
    • Git e Github
    • Funções e dependências
    • Pacotes
  • Manipulação de dados
    • dplyr avançado: across(), where() e joins
    • Manipulação de textos com o pacote {stringr}
    • Manipulação de datas com o pacote {lubridate}
  • Visualização de dados
    • Extensões do pacote {ggplot2}
    • Construindo mapas com o geom_sf()
    • Construindo seu próprio tema no {ggplot2}
  • Programação funcional
    • Listas e list-columns
    • Introdução ao pacote {purrr}
    • Substituindo for e while pelas funções map_()
  • Comunicação
    • Introdução ao Shiny
    • A lógica ui/server
    • Inputs e outputs
    • Hospedando um aplicativo no shinyapps.io
dplyr

Porque a maior parte do trabalho é manipulação de dados.

stringr

Regendo os seus textos.

lubridate

Está na hora de aprender a manipular datas.

purrr

Porque cada vez que você usa um for, um gatinho morre.

ggplot2

Fazer gráficos é uma arte.

devtools

Somos todos desenvolvedores!

shiny

Suas análises fazendo olhos brilharem.

tidyverse

A filosofia tidy.

usethis

Tarefas rotineiras em funções de R.


Professores

Doutor em Estatística pelo IME-USP com projeto depesquisa na área de poluição do ar. Trabalhando diaramente com análise de dados e programação em R. Escritor nas horas vagas.


William Amorim
    
  

Mestrando em Ciência da Computação no IME-USP e cientista de dados na Terranova Consultoria. Programador desde os 15 anos, começou a se apaixonar pelo R em 2016 e agora não fala em outra coisa. Metido a designer, maníaco da organização e metade texano


Caio Lente
    


Como será o curso?

  • Aulas online, em tempo real, com um(a) professor(a) e um(a) monitor(a).
  • Diversos exercícios “para casa” para praticar e tirar dúvidas.
  • Projeto de análise de dados para aplicar o conteúdo aprendido.
  • Gravação das aulas disponíveis por pelo menos 1 ano.


Pré-requisitos

  • O conteúdo do curso R para Ciência de dados I

  • Conhecimentos básicos de Estatística: média, mediana, variância, proporção.


O que eu preciso ter?

  • Um notebook com acesso a internet e permissão para instalar novos programas;

  • Uma conta de e-mail Google para acessar o Google Classroom;

  • Últimas versões do R e do RStudio instaladas 😻.

Inscreva-se agora para embarcar nessa nova jornada pelo universo da Ciência de Dados!