Linguagem R – Estatística aplicada a Machine Learning Usando R Studio, SAS Studio ou Power BI (Módulo 02)

Visão Geral do Treinamento

  • Se você deseja trabalhar fazendo previsões futuras do comportamento do negócio através de compilações de modelos estatísticos usando a mais famosa linguagem computacional para esta finalidade (R), este treinamento é para você! Veja…
  • Focamos na aplicação de métodos estatísticos aplicados na linguagem R, também trará clareza sobre uma área especifica da Inteligência Artificial chamada Machine Learning, que é baseada na inteligência de negócios voltada para dados estatísticos atuando na construção de modelos preditivos, modelos estes que trarão respostas sobre comportamento futuro do negócio para auxiliar a tomada de decisão.
  • Ao contrário do BI (Business Intelligence), que visa saber os comportamentos do passado através de modelos de dados existentes, o Machine Learning fará previsão do comportamento futuro através desses mesmos dados que serão submetidos a uma compilação específica, usando ferramentas de mercado, Linguagem R e Machine Learning.

Sobre o treinamento:

  • Carga Horária: 40 Horas
  • Tipo: Presencial

Metodologia Aplicada:

  • Aula expositiva e dinâmica com exercícios previamente desenvolvidos, mas não limitados a estes, podendo assim ser reproduzido simulações com situações de cases reais do participante uma vez que toda turma estiver de acordo..

Público Alvo

  • Profissionais que desejam trabalhar com Big Data Analytics e utilizar os principais conceitos de análise de dados através das mais poderosas ferramentas analíticas do mercado de Big Data.

Pré-Requisitos

  • Ter concluído o Treinamento da Evolutiontech “Linguagem R – Fundamentos e Aplicação” ou conhecimentos equivalentes.
  • Conhecimentos gerais de Matemática Estatística para Analise preditiva de Negócios.
  • Conhecimentos gerais sobre ciência da computação.
  • Conhecimentos gerais sobre área de negócio.

Recursos Utilizados

  • Instrutor qualificado para o projeto
  • Material didático
  • Certificado na conclusão

Conteúdo Programático

Parte 01 – Introdução – O Cientistas de Dados e a Análise Estatística Usando o software estático SAS Studio.

  • O Que é Data Science?
  • Como Fazer Download e instalar o software estático SAS Studio.
  • Primeiros passos no SAS Studio
  • O uso da Linguagem R no SAS Studio
  • Como a estatística se torna uma ferramenta para o Cientistas de Dados
  • Estatística Descritiva x Estatística Inferencial
  • GDPR e a Lei de Proteção aos Dados
  • O Que São Fontes de Dados e para que servem?
  • Variáveis e Tipos de Variáveis
  • Definição de Variáveis (Categóricas ou Qualitativas)
  • Plataformas de mercado para Análise Estatística
  • O que é Machine Learning?
  • Existem 3 Regras para Análise de Dados!
  • O que são Tabelas de Frequência, quanto a classificação de seus tipos
  • Para que servem os tipos de Tabelas de Frequência tipos

Parte 02 – Realizando uma Análises Quantitativas e Qualitativas

  • Analise gráfica para Variáveis Qualitativas
  • Trabalhando com Tabelas de Contingência e Interpretação de resultados de dados categóricos
  • Definindo Variáveis Quantitativas Discretas e Contínuas
  • Trabalhando em R com Medidas de Tendência Central
  • Medidas de Tendência Central – Média, Mediana e Moda
  • Como escolher uma Medida?
  • Trabalhando em R com Medidas de Dispersão
  • Trabalhando em R com Medidas de Posição Relativa (Quartis e Percentis)
  • Usando o Gráficos correto para a sua Medida
  • Usando Gráficos Boxplots
  • Sumarização e Interpretando Boxplots
  • Trabalhando com Padronização de Dados e dando tratamento aos Outliers

Parte 03 – Trabalhando com Associações e Correlações

  • O que é Análise Bidimensional para Associação
  • Praticando Associação com linguagem R usando Variáveis Qualitativas
  • Usando Medidas de Associação com Variáveis Qualitativas
  • Trabalhando com Scatter Plots (Analisando e Interpretando)
  • Atribuindo Funções as Variáveis no Scatter Plot
  • Criando condições para fazer uma Correlação
  • Condições Para Análise da Correlação e Causalidade.

Parte 04 – Trabalhando com Probabilidade na Linguagem R

  • Probabilidade, uma ciência Empírica, e a Lei dos Grandes Números
  • O Que é, e por quê a Probabilidade é tão importante para Data Science?
  • Quais os Tipos de Probabilidades que vamos enfrentar?
  • Trabalhando com Probabilidade em linguagem R com Experimentos Aleatórios
  • Regras da Probabilidade
  • Probabilidade Conjunta, Condicional e Independência
  • Tabelas de Contingência e Árvores de Probabilidade
  • Usando a Regra de Bayes
  • Trabalhando com Análise Combinatória
  • Case – Tratamento de dados usando recursos da linguagem R (Encontrando Correlações Espúrias em Big Data e como resolver).

Parte 05 – Usando Variáveis Aleatórias e Distribuições de Probabilidade

  • O Que São Variáveis Aleatórias e Distribuições de Probabilidade?
  • Usando R para encontrando o Valor Médio, Desvio Padrão e Variância de uma Variável Aleatória Discreta
  • A Importância do Desvio Padrão para Data Science?
  • Fazendo contas com Variáveis Aleatórias Discretas (Soma e Subtração e encontrado a Correlação
  • Trabalhando em R com Distribuição Uniforme Discreta, Geométrica, Binomial e de Poisson
  • Trabalhando com Variáveis Aleatórias Contínuas
  • Trabalhando com a Função de Densidade
  • Distribuição Uniforme e Normal (Como Determinar isso)
  • Qual o motivo e maior relevância de usar Distribuição Normal para Data Science?
  • Sobre o Teorema Central do Limite
  • Como Interpretar e Montar a Curva Normal usando linguagem R?
  • Trabalhando com Distribuição Exponencial, Distribuição Qui-Quadrado, Distribuição t de Student e Distribuição F
  • Trabalhando com a Função de Densidade de Probabilidade usando linguagem R?
  • Case – Usando linguagem R (Variáveis Aleatórias e Distribuições de Probabilidade)

Parte 06 – Fazendo o uso da Inferência Estatística (Amostragem, Proporções e Intervalos de Confiança)

  • Distribuições de Amostragem e Proporções
  • Proporção Amostral x Proporção Populacional
  • Determinando a estimativa para a Proporção Populacional
  • Estimador Pontual / Estimativa Intervalar (Proporção Amostral X Intervalos de Confiança)
  • Usando Coeficiente de Confiança do Intervalo
  • Dimensionamento e Redução de uma Amostra
  • Determinando as Proporções de um Intervalo de Confiança
  • Case – Inferência Estatística usando linguagem R
  • O Que é Teste de Hipótese?
  • Decisões / Hipóteses Estatísticas
  • Como Construir um Teste de Hipóteses
  • Teste de Hipótese e Significância
  • Trabalhando os Tipo de Erros I e II e Níveis de Significância
  • Case – construindo um Teste de Hipótese em linguagem R usando Variáveis, Distribuições de Probabilidade e Inferência Estatística

Parte 07 – Trabalhando com Análise de Variância (Experimentos)

  • O que é Variação Total e Métodos Abreviados
  • Análise de Variância Linear
  • Distribuições das Variações e os Valores Esperados
  • Experimentos de Um e Dois Fatores
  • Variações Para Experimentos de Dois Fatores
  • Análise de Variância Para Experimentos de Dois Fatores
  • Experimentos de Dois Fatores com Repetição
  • Case – Trabalhando com experimentos e Análise de Variância usando linguagem R

 

Fale Conosco

Solicite o conteúdo completo ao nosso departamento comercial

 

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *