Curso Online

Machine Learning

Trilha de Formação em Data Science

Cientistas de dados são profissionais responsáveis por analisar, descrever e modelar grandes massas de dados e a habilidade de construir bons modelos preditivos é um dos pré-requisitos mais solicitados pelo mercado hoje em dia. Nessa trilha, você vai aprender, o que são, quando utilizar e como ajustar modelos de Machine Learning utilizando o R. Além da prática, também discutiremos o que cada um dos principais algoritmos faz por trás das cortinas e como interpretar seus resultados.

data do curso13 de março à 29 de julho, com aulas às segundas, quintas e sábados
As aulas são ao vivo. Você terá contato direto com as(os) prefessoras(es)!
Confira abaixo o calendário de aulas de cada curso.
tempo de curso 20 aulas, 60 horas de curso

de R$2200 por:

R$1980

Ao se inscrever no curso, você declara estar de acordo com os nossos Termos de uso.

Habilidades adquiridas no curso

Organização de projetos de modelagem
Métricas e funções de custo
Overfitting
Bases de treino/teste/validação
Validação cruzada
Curva ROC
Regressão linear
Regressão logística
Árvores de decisão
Random forest
XGBoost
Deep learning

Programa do curso

O programa do curso é separado em 4 blocos, encapsulando os conteúdos em jornadas que amplificam a construção do conhecimento. Os cursos de Machine Learning e Deep Learning acontecerão às segundas e quintas, das 19h00 às 22h00. Os cursos de Regressão Linear e XGBoost acontecerão aos sábados, das 9h00 às 12h00. Não haverá aula em feriados e emendas de feriados.

O que vou receber?

Certificados dos cursos

Entrega digital após conclusão

Cursos 100% on-line

As aulas são ao vivo, mas ficam gravadas e a disposição por 1 ano

Português

Nível básico

Não exige experiência prévia.

Cursos do programa

Clique no nome de cada curso para acessar suas páginas individuais.

curso

1

REGRESSÃO LINEAR

data do curso 13, 20 e 27 de março, três sábados, das 9h00 às 12h00
tempo de curso3 aulas, 9 horas de curso

A regressão linear é historicamente a técnica mais discutida e utilizada na Estatística. Graças à sua facilidade de implementação e interpretação e por se ajustar bem a diversos problemas reais, ela é aplicada para modelagem de dados e testes de hipóteses nas mais diversas áreas do conhecimento.

O objetivo deste workshop é apresentar os principais conceitos por trás da regressão linear, discutindo quando é razoável aplicar essa técnica e como ajustá-la utilizando o R. Também vamos abordar interpretação de parâmetros, testes de hipóteses e técnicas para avaliar se nossos modelos estão bem ajustados.

Introdução

  • O que é e quando usar regressão linear
  • O que são parâmetros e como interpretá-los

Ajuste

  • Implementação de modelos de regressão linear no R
  • Transformações nas variáveis
  • Interações de variáveis

Testando hipóteses

  • Construindo intervalos de confiança
  • Construindo testes de hipóteses
  • O valor p

Diagnóstico

  • Avaliando as suposições do modelo
  • Avaliando outliers
  • Avaliando a qualidade do ajuste

curso

2

INTRODUÇÃO AO MACHINE LEARNING

data do curso 26 de abril a 20 de maio, às segundas e quintas, das 19h00 às 22h00
tempo de curso 8 aulas, 24 horas de curso

Machine Learning é um framework de análise preditiva, muito utilizado hoje em dia em problemas de classificação. Sua fama recente se deve ao sucesso em aplicações de transcrição de áudio e classificação de imagens, mas uma grande parte de suas técnicas são muito úteis em qualquer problema de modelagem estatística.

O objetivo deste curso é apresentar as etapas essenciais de um projeto de Machine Learning, desenvolvendo a análise crítica necessária para escolher, ajustar, avaliar e interpretar modelos preditivos, utilizando o R como ferramanta. Também será discutido aspectos teóricos para compreender como a matemática dos modelos funciona por trás.

O que é Machine Learning

  • História
  • O que é modelagem preditiva
  • Definições e Nomenclaturas
  • Por que e quando usar
  • Métricas e Funções de Custo

Conceitos Centrais

  • Overfitting
  • Hiperparâmetros
  • Bases de Treino/Teste/Validação
  • Cross-Validation
  • Relação Viés-Variância

Modelos de Regressão

  • Regressão Linar
  • RMSE, MAPE, R2.
  • Gradient Descent
  • Estimadores e estimativas
  • Regularização LASSO
  • Principais cuidados com os dados

Modelos de Classificação

  • Regressão Logística
  • Binary Cross-entropy (Deviance)
  • Probabilidades vs Classes
  • Matriz de Confusão
  • Curva ROC
  • Acurácia, recall, precisão, F1, AUROC.

Modelos de Árvores

  • Árvores de decisão
  • GINI e Entropia
  • Ganho de Informação
  • Random Forest
  • Gradient Boosting (XGBoost)

Tidymodels

  • O que é
  • Como usar
  • {workflows} e {recipes}

curso

3

XGBOOST

data do curso 12, 19 e 26 de junho, três sábados, das 9h00 às 12h00
tempo de curso 3 aulas, 9 horas de curso

O XGBoost é um dos algoritmos mais utilizados atualmente para resolver problemas de modelagem preditiva, sendo um dos modelos mais vezes campeão de competições do Kaggle.

O objetivo deste workshop é apresentar os principais conceitos por trás desse algoritmo e mostrar como ajustar, tunar e avalir a sua performance. Também vamos discutir sobre o framework do Machine Learning e apresentar algumas técnicas de interpretabilidade.

Introdução

  • O que é e quando utilizar o XGBoost
  • Criando um XGBoost passo-a-passo

Ajuste

  • Tuning do modelo
  • Overfitting e validação cruzada
  • Métricas de performance
  • Introdução ao Tidymodels
  • Ajustanto um XGBoost no R com Tidymodels
  • Tradução de um XGBoost em SQL

curso

4

DEEP LEARNING

data do curso 12 a 29 de julho, às segundas e quintas, das 19h00 às 22h00
tempo de curso 6 aulas, 18 horas de curso

Deep learning é uma classe de modelos que ficou famosa nos últimos anos dentro do Machine Learning por resolver problemas historicamnte difíceis de detecção de imagem, transcrição de áudio e classificação de textos.

O objetivo deste curso é se familiarizar com as principais técnicas utilizadas em Deep Learning, discutindo como funcionam as redes neurais, quais são os softwares utilizados para treiná-las e quais são as principais técnicas para tunar esses modelos.

Introdução

  • O que é e quando utilizar Deep Learning
  • O que são redes neurais profundas

Ajuste

  • Ajustando modelos de deep learning no R
  • O pacote keras
  • Técnicas de regularização

Arquiteturas

  • Redes neurais recorrentes (RNN)
  • Redes neurais convolucionais (CNN)
  • Long short-term memory (LSTM)

Como será o curso?

  • Aulas online, em tempo real, com um(a) professor(a) e um(a) monitor(a).
  • Diversos exercícios “para casa” para praticar e tirar dúvidas.
  • Projeto de análise de dados para aplicar o conteúdo aprendido.
  • Gravação das aulas disponíveis por pelo menos 1 ano.

Pré-requisitos

  • Interesse por Ciência de Dados
  • Conhecimentos básicos de computação: criação de arquivos e pastas, instalação de programas, navegação na internet.
  • O conteúdo do nosso curso R para Ciência de Dados I.

Professores

ATHOS DAMIANI

Bacharel em Estatística pelo IME-USP e mestrando em IA pela Poli-USP. Trabalhou com modelos preditivos, web scraping e visualização/dashboards para ABJ, IBOPE, ClearSale, EDP e Itaú. Se interessa por tudo ligado ao R e à Estatística.

DANIEL FALBEL

Bacharel em Estatística pelo IME. Software Engineer na RStudio. Trabalha diariamente com R há mais de 7 anos. É interessado por tudo que tem a ver com R, Machine Learning e Estatística

FERNANDO CORRÊA

Bacharel e mestrando em Estatística pelo IME-USP. Ex-diretor da Associação Brasileira de Jurimetria. Usa R para tudo, mas tem interesse especial em web scraping, visualização de dados e modelagem bayesiana.

Perguntas Frequentes - FAQ

Sim! Basta acessar a página Curso-R.com.br/cursos e se inscrever. Mas ressaltamos que os preços promocionais dessa página só se aplicam aos pacotes completos.

Sim, você receberá o certificado ao final do curso (sujeito à entrega de atividades solicitadas pelos professores), com a carga horária específica delimitada na página do curso. O certificado é individual e terá o mesmo nome que você utilizou na compra.

Sim, as aulas são gravadas e disponibilizadas para os alunos inscritos por pelo menos 1 ano.

Após a confirmação da compra, você receberá um e-mail de nossa equipe com a confirmação de sua inscrição, com as informações para entrar na turma pelo google classroom.

Caso você não receba email de confirmação antes do curso começar, primeiramente dê uma olhada na sua caixa de spam. Caso não esteja lá, basta nos enviar um e-mail para contato@Curso-R.com.

Depende do curso, todas as informações necessárias para ingressar em qualquer curso da Curso-R pode ser encontrada na sua respectiva página. As trilhas são pacotes promocionais de cursos com grandes descontos. O preço das trilhas pode ser encontrado também nas suas páginas.

Nós trabalhamos com cartão de crédito, boleto e transferência bancária.