O que é uma Regressão?

Olá, investidor(a)! No artigo de hoje, vamos aprender sobre uma das principais ferramentas estatísticas utilizadas em finanças, medicina, marketing e até futebol: Regressão.
- O que é uma regressão?
- Onde utilizamos regressões?
- Tipos de regressão
- Análise de regressão em finanças
- Conclusão
Boa leitura!
O que é uma regressão?
O conceito de regressão foi introduzido pelo antropólogo Francis Galton, em um estudo envolvendo pais e filhos, notou que apesar de pais altos normalmente terem filhos altos e pais baixos normalmente terem filhos baixos, a média da altura dos filhos tendem a se mover ou a “regredir” em torno da média de altura da população (da região) como um todo.
O estatístico Karl Pearson também chegou à mesma conclusão. Ao investigar milhares de dados de altura de membros de famílias, notou que a média da altura dos filhos de um grupo de pais altos era menor que a altura dos seus pais e a média da altura de um grupo de filhos de pais baixos era maior que a altura de seus pais. “Regredindo”, assim, a altura dos filhos em torno da média de todos os homens da população.
O conceito moderno
Apesar de ter surgido em estudos que buscavam verificar a estabilidade na distribuição de alturas de uma população, a abordagem moderna de regressão é um pouco distinta.
Tomando o mesmo exemplo, o objetivo de uma regressão nos termos atuais seria descobrir em que medida a média das alturas dos filhos muda dadas as alturas dos pais. Seria “prever” a média de altura dos filhos sabendo a altura de seus pais.
Em termos mais gerais, uma regressão busca examinar a relação entre uma variável dependente (altura dos filhos) e uma ou mais variáveis independentes (alturas dos pais).
Apesar de inicialmente parecer um conceito distante do campo de finanças e investimentos, veremos que a análise de regressão ajuda investidores a precificar ativos e entender como as diversas variáveis do mercado se relacionam.
Tipos de regressão
Regressão Linear Simples
Anteriormente, quando discutimos o conceito de regressão de forma mais geral, intuitivamente estávamos falando da forma mais simples de análise de regressão, conhecida como bivariada ou regressão linear simples.
Este modelo busca encontrar a relação entre uma variável dependente e uma variável independente. Apesar de não ser a forma mais utilizada para encarar problemas que enfrentamos no mundo real, sua intuição é útil para entender a ideia de regressão de forma simples.
Sua equação genérica é dada por:
Y = β[1] + β[2]X[1] + μ
Onde:
- Y: Variável dependente
- β[1]: Intercepto
- β[2]: Inclinação da reta
- μ: Resíduo (erro) da regressão
Para que o modelo de regressão linear simples funcione, são necessários alguns pressupostos:
- As variáveis possuem uma relação linear entre a inclinação e o intercepto
- A variável independente não é aleatória
- O termo de erro (ϵ) tem valor zero e é constante em todas as observações.
- O termo de erro (ϵ) não tem correlação entre as observações
- O termo de erro (ϵ) segue uma distribuição normal
Regressão Linear Múltipla
Como dito, o modelo de duas variáveis é um tanto inadequado para resolver problemas práticos.
Tomando o exemplo citado anteriormente, da relação entre o preço do barril do petróleo e o retorno das ações de uma petrolífera, sabemos que na prática, não é só o preço do petróleo que impacta o retorno das ações (ainda mais no Brasil).
Por isso, para fazer um modelo mais próximo da realidade, é preciso envolver mais de duas variáveis, é aí que entra o modelo de regressão linear múltipla.
Neste modelo, temos uma variável dependente (Y), dependendo de duas ou mais variáveis explicativas (regressores).
A forma mais simples de fazer um modelo de regressão linear múltipla é utilizando três variáveis:
Yi = β1 + β2 X2i + β3 X3i + μi
Onde:
- Y: Variável dependente
- β[1]: Intercepto
- β[2] e β[3]: inclinações
- X[2] e X[3]: Variáveis independentes
- μ: Resíduo (erro) da regressão
Como também se trata de um modelo linear, o modelo de regressão linear múltipla necessita dos mesmos pressupostos, com a adição da não colinearidade:
- As variáveis possuem uma relação linear entre a inclinação e o intercepto
- A variável independente não é aleatória
- O termo de erro (ϵ) tem valor zero e é constante em todas as observações.
- O termo de erro (ϵ) não tem correlação entre as observações
- O termo de erro (ϵ) segue uma distribuição normal
Não colinearidade: As variáveis independentes não devem ter uma relação linear exata entre si. Se forem muito correlacionadas se torna difícil estabelecer uma relação entre a variável dependente e as independentes.
Regressão Não Linear
A regressão não linear é um método utilizado para encontrar uma relação entre uma variável independente e várias variáveis independentes que não possuem uma relação linear. O ajuste dos dados é feito através de aproximações sucessivas.
É comum converter relações não lineares em relações lineares, isso é feito através de alguns métodos, o mais usado é o da log-linearização.
Onde utilizamos regressões?
Existem diversas aplicações para a análise de regressão, embora no mundo real problemas são influenciados por “n” variáveis, vamos exemplificar quais tipos de perguntas uma regressão simples com duas variáveis poderia ajudar a responder:
- Finanças: O quanto o aumento no preço do petróleo (variável x) afeta o preço das ações da petrolífera XPTO (variável y).
- Medicina: O quanto uma vacina para um vírus (variável x) afeta a taxa de mortalidade do mesmo (variável y).
- Futebol: O quanto o número de gols de um atacante de um time de futebol (variável x) afeta o número de vitórias da equipe (variável y).
- Política: O quanto um dado programa de benefício social (variável x) afeta a porcentagem votos do candidato A (variável y).
- Marketing: O quanto o investimento em propaganda do produto A (variável x) afeta a receita da companhia (variável y).
Análise de Regressão em Finanças
Em finanças, talvez o método de análise de regressão mais conhecido seja o Capital Asset Pricing Model (CAPM). A equação do CAPM determina a relação entre o retorno esperado de um ativo e o prêmio de risco do mercado.
E[Ri] = Rf + βi (E[Rm] – Rf)
Em que:
- E [Ri] é o retorno esperado do ativo i;
- βi é o beta do ativo i;
- Rf é o retorno da taxa livre de risco;
- E [Rm] é o retorno esperado do mercado;
- E [Rm] – Rf é o Prêmio de Risco de Mercado.
CAPM e o Beta
Através da equação do modelo CAPM, também podemos usar uma regressão para calcular o beta de uma ação em relação ao seu índice de referência. O beta indica o quanto um ativo varia dada uma variação do seu índice de referência.
Portanto, na regressão linear ele é dado pelo coeficiente angular ou inclinação da reta de regressão.
Conclusão
A análise de regressão é um dos tópicos mais importantes do campo estatístico, é bastante utilizada em finanças pois permite determinar o grau em que fatores do mercado (variáveis independentes) influenciam no retorno de certos ativos (variáveis dependentes).
Além de ter moldado o modelo de CAPM, a equação de regressão serviu de base para diversos outros modelos mais complexos.
Baixe nosso app grátis! No TC você acompanha as principais notícias e cotações do mercado em tempo real, além de ter acesso a canais exclusivos para interagir com os melhores profissionais.
Estude e conheça! Aprenda com quem realmente entende de investimentos. Tire dúvidas, troque ideias, experiências e construa uma grande rede de networking com investidores de todo Brasil.
A gente também está no Instagram, YouTube e no TikTok. Acompanhe!
Referências
Gujarati, D. N., & Porter, D. C. (2009). Basic econometrics. Boston, Mass: McGraw-Hill.

E-BOOK
Aprenda tudo sobre contabilidade
Neste e-book — “Contabilidade”, trazemos informações e conceitos importantes sobre contabilidade financeira.
Artigos relacionados
Receba todas as novidades do TC
Deixe o seu contato com a gente e saiba mais sobre nossas novidades, eventos e facilidades.
Receba todas as novidades do TC
Deixe o seu contato com a gente e saiba mais sobre nossas novidades, eventos e facilidades.