Como preparar meu Excel para uma Regressão Linear
Recentemente tive a oportunidade de dar uma aula de introdução à regressão linear e acredito que o conteúdo pede um complemento que permita que as pessoas coloquem a mão na massa e de fato comecem a desbravar a regressão linear. Antes de mais nada, apenas para ficarmos todos na mesma página, irei utilizar o Excel para resolver estes exercícios, mas também é possível utilizar o Google Sheets para isso, obtendo resultados levemente diferentes. Para garantir que todos consigam utilizar o Excel, escrevi um guia bem rápido de como instalar o add-in necessário e como incluir informações gráficas que auxiliam nos estudos.
Antes de começar…
Antes de começarmos a estudar nossos problemas, vamos preparar o nosso Excel. Vamos utilizar um addin nativo do software, mas que exige habilitação manual, o Analysis ToolPak.
Nota: Eu uso o Excel em inglês, caso você use em português, leia o material que a própria Microsoft criou para ajudar na instalação do add-in. Se você é usuário de macOS, existe um substituto, que eu nunca testei, portanto não consigo afirmar sobre sua qualidade e eficiência.
Com o Excel aberto, vá em File, para conseguir acessar as opções (Option).
Dentro das opções, selecione no menu esquerdo os Add-ins. O Analysis ToolPak por padrão fica inativado no Excel.
No canto inferior esquerdo, existe uma opção de Manage Excel Add-ins. É necessário clicar em Go… para poder selecionar o Analysis ToolPak para ser habilitado: é necessário selecionar a caixa de seleção e depois clicar em OK.
Como usa?
Depois que instalamos o add-in, é possível acessá-lo na aba Data, no canto da direita. Ao clicar nele, uma nova janela se abre, onde é possível escolher diversas análises estatísticas, não apenas a Regressão Linear.
Dentre as diversas opções que o add-in oferece, vamos escolher, para os exercícios de Regressão Linear, o de Regression.
O Analysis ToolPak oferece diversas ferramentas de análise estatística, não se limitando à Regressão Linear
Ao selecionar a ferramenta que quer usar, o Excel abre um novo pop-up onde é possível incluir as informações de análise. É importante ressaltar que é necessário escolher o intervalo exato de células que contém informações de Y e de X.
Aqui eu deixei um exemplo de retorno que a ferramenta traz, com alguns elementos importantes que usaremos nos nossos exercícios já destacados.
E graficamente, como que se faz?
Além da análise que a ferramenta Analysis ToolPak nos dá, também conseguimos tirar ótimos insumos com o recurso de gráficos do Excel. Para criar um gráfico, basta selecionar os dados, ir na aba Insert e em Charts.
Para a regressão linear iremos utilizar o scatter plot. Dentre as opções, escolha a primeira, que fica no canto superior esquerdo. Ela não é de bolha e não tem nenhuma linha.
Depois de clicar na opção do gráfico, um será gerado com os dados selecionados, como a imagem abaixo.
Ao clicar na seta verde que dá mais opções de elementos gráficos, na última opção, temos a linha de tendência. O ideal é selecionar linear e depois clicar em More Options….
Ao formatar a linha de tendência, muitas opções são dispostas, onde também conseguimos ver opções de tendência logarítmica, por exemplo. Para os nossos exercícios também vamos precisar selecionar o Display Equation on chart e Display R-squared value on chart.
Depois de selecionar esses itens, o gráfico é atualizado automaticamente, conforme a imagem abaixo.
E agora?
Depois de deixar tudo pronto e ter entendido como fazer a análise gráfica, vamos partir para alguns exercícios práticos!