XGBoost

12 de junho a 26 de junho, três sábados, das 9h00 às 12h00

3 aulas, 9 horas de curso

Online

R$450,00




Ao se inscrever no curso, você declara estar de acordo com os nossos Termos de uso.

Conheça o curso

O XGBoost é um dos algoritmos mais utilizados atualmente para resolver problemas de modelagem preditiva, sendo um dos modelos mais vezes campeão de competições do Kaggle.

O objetivo deste workshop é apresentar os principais conceitos por trás desse algoritmo e mostrar como ajustar, tunar e avalir a sua performance. Também vamos discutir sobre o framework do Machine Learning e apresentar algumas técnicas de interpretabilidade.

Você sairá deste curso apta(o) a:
  • organizar um projeto de Machine Learning;
  • utilizar o XGBoost em problemas de modelagem preditiva;
  • ajustar um XGBoost utilizando o R;
  • avaliar a performance dos seus modelos preditivos.


Conteúdo

  • O que é e quando utilizar o XGBoost
  • Criando um XGBoost passo-a-passo
  • Tuning do modelo
  • Overfitting e validação cruzada
  • Métricas de performance
  • Introdução ao Tidymodels
  • Ajustanto um XGBoost no R com Tidymodels
  • Tradução de um XGBoost em SQL
tidymodels

A filosofia tidy também para modelar.

parsnip

Interface unificada de modelos de machine learning.

rsample

Reciclando a sua base de dados.

recipes

Construindo receitas para um modelo perfeito.

yardstick

Medindo a performance do seu modelo.

dials

Tunando o seu modelo.


Professores

Bacharel em Estatística pelo IME-USP e mestrando em IA pela Poli-USP. Trabalhou com modelos preditivos, web scraping e visualização/dashboards para ABJ, IBOPE, ClearSale, EDP e Itaú. Se interessa por tudo ligado ao R e à Estatística.


Athos Damiani
    
  

Bacharel em Estatística pelo IME. Trabalha diariamente com R há mais de 6 anos. É interessado por tudo que tem a ver com R, Machine Learning e Estatística


Daniel Falbel
    


Como será o workshop?

  • Aulas online, em tempo real, com um(a) professor(a) e um(a) monitor(a).
  • Exercícios “para casa” para praticar e tirar dúvidas.
  • Projeto de análise de dados para aplicar o conteúdo aprendido.
  • Certificado ao final do curso (sujeito à entrega de atividades solicitadas pelos professores).
  • Gravação das aulas disponíveis por pelo menos 1 ano.


Pré-requisitos

  • O conteúdo do curso R para Ciência de dados I

  • O conteúdo do curso Introdução ao Machine Learning

  • Conhecimentos básicos de Estatística: média, mediana, variância, proporção;

  • Conhecimentos básicos de computação: criação de arquivos e pastas, instalação de programas, navegação na internet.


O que eu preciso ter?

  • Um notebook com acesso a internet e permissão para instalar novos programas;

  • Uma conta de e-mail Google para acessar o Google Classroom;

  • Últimas versões do R e do RStudio instaladas 😻.

Inscreva-se agora para embarcar nessa nova jornada pelo universo da Ciência de Dados!