Web scraping em R

A definir

Curso de 8 horas

A definir

R$500,00

Ainda não estamos com turmas abertas para esse curso. Deixe seu e-mail para avisarmos assim que a turma abrir.

Conheça o curso

Web scraping é a tarefa de extrair dados da internet de forma automatizada. Dificuldade de acesso a dados públicos gerada por sistemas mal construídos ou motivação política torna essa prática uma etapa essencial em diversas análises.

O objetivo deste curso é apresentar as principais ferramentas e estratégias para fazer web scraping utilizando o R. Para isso, abordaremos as noções básicas de como um site é construído, como funcionam as requisições web e como descobrir o caminho até um conteúdo específico de uma página.

Você sairá deste curso apto a construir scrapers para coletar dados da internet de forma automática e eficiente, tudo dentro do R.

Ao decorrer do curso, abordaremos os seguintes tópicos:

  • noções de protocolo HTTP e acesso a páginas web;
  • pacote httr para fazer requisições HTTP e baixar páginas web com o R;
  • pacotes xml2, rvest e jsonlite para obter informações estruturadas de arquivos .xml, .html e .json;
  • pacote pdftools para extrair informações de PDFs.


Para quem é este curso?

Este curso é destinado a estudantes e profissionais que trabalham com análise de dados e precisam extrair informações de páginas da internet.

O que eu preciso saber?

Alguns pré-requisitos são necessários para o completo entendimento das aulas. Também recomendamos alguns tópicos para uma melhor experiência do curso.

Necessário

Programação:

  • noções básicas de lógica de programação, como operações lógicas e controladores de fluxo (if, else);
  • conhecimento básico de programação em R:
    • sintaxe e vocabulário básico;
    • criação de objetos e funções;
    • criação e manipulação de vetores;
    • criação e manipulação de data frames.

Recomendado

Programação:

  • utilização do operador pipe (%>%);
  • manipulação de dados com os pacotes dplyr e tidyr.


O que eu preciso levar?

Durante as aulas, você vai precisar de:

  • um notebook com acesso a internet;
  • últimas versões do R e do RStudio instaladas;
  • permissão para instalar novos programas.

Também recomendamos levar a fonte do notebook e um adaptador de tomada (as salas podem possuir apenas padrões antigos).

Ainda não estamos com turmas abertas para esse curso. Deixe seu e-mail para avisarmos assim que a turma abrir.

Professores