Plus500

8.12.11

Análise Estatística: Reversão à Média

Você já se encontrou na seguinte posição:

Está comprado em determinado ativo, os preços ao longo de vários dias começam a cair, dia após dia, até o momento em que aquilo que foi ganho a custo de meses se perde em uma fração desse tempo.

Nesse momento existem dois tipos de raciocínios comumente usados:

1) Se o preço está caindo dia seguido de dia por tanto tempo, é bem provável que amanhã ele caia de novo. Melhor vender minha posição.

2) Não é possível que depois do preço ter caído por tanto tempo, ele continue caindo. Ficarei comprado esperando a correção do preço.

Bem, nenhum dos dois raciocínios está necessariamente certo ou errado. Saber com certeza quando uma queda ou alta de preços entrará em reversão ou manterá seu movimento é o Santo Graal de qualquer mercado financeiro, e assim permanecerá por muito tempo, pois tal certeza é impossível.

Mas isso não significa que nós não podemos nos divertir tentando. Então vamos fazer uma análise sobre um experimento. Olhe para este gráfico, o que você vê?


Se você disse que esse é o nosso IBOV desde 1998, parabéns você acertou! Embora eu me pergunte sobre quais são as implicações desse fato sobre a sua vida social... Ao mesmo tempo raciocínio análogo poderia ser feito sobre a minha vida dado que sou eu escrevendo agora num domingo à tarde, mas esse é assunto para outro artigo improvável.

Poderia se dizer que esse é um gráfico de um ativo com tendência de longo prazo de preço crescente com várias oscilações ao redor dessa média, ou expresso em outro gráfico, poderia se dizer que esse gráfico também poderia ser visto assim:

Repare que sempre que o IBOV está abaixo da linha vermelha, que é a sua linha de crescimento médio, ele eventualmente cruza ela para cima. E sempre que está acima ele cruza ela para baixo. Isso sinaliza uma tendência de reversão à média? Será que o IBOV como indicador direto de mercado financeiro, e indireto da economia apresenta um comportamento dócil no longo prazo com oscilações em curto prazo? E se sim, seria possível operar em cima disso?

Vamos fazer uma simulação rápida.

Simulação

Vamos pegar os dados de fechamento do IBOV (A) desde 1998 até 2010.

Para toda essa série será interpolada uma função exponencial (B), o que significa uma reta estando o gráfico em escala log.

Para cada dia teremos A/B. Quando essa razão ficar abaixo de PC (Patamar de Compra) nós ficaremos comprados, quando ficar acima de PV (Patamar de Venda) ficaremos vendidos.

Hipóteses: Ordens limitadas, ausência de custos transacionais, liquidez perfeita.

Resultados

Qual o ganho que seria obtido para vários valores de PC e PV?

Os resultados estão expressos em G/N.

G = ganhos em múltiplos (quantos R$ você teria se tivesse começado com R$1)

N = Número de operações realizadas no período

PC\PV

1.1

1.2

1.3

1.4

0.6

26.5 / 7

60.7 / 7

82.4 / 7

107 / 7

0.7

16.2 / 7

39.1 / 7

53.7 / 7

70.5 / 7

0.8

7.4 / 7

19.9 / 7

28.3 / 7

37.9 / 7

0.9

6.9 / 9

12.4 / 7

18.0 / 7

24.6 / 7

A pior combinação rendeu ganhos de 6,9x, o que é equivalente a estratégia neutra de ter ficado comprado em IBOV durante o período.

“Uau! Então essa é uma estratégia que apresenta ganhos bem superiores aos ganhos da média do mercado com freqüência inferior a uma operação por ano? Finalmente poderei me aposentar aos 40 anos com minha esposa e filhos numa mansão no Havaí e um mordomo chamado Clemêncio?”

Não tão rápido, existe uma hipóteses implícita na maneira como foi feita a simulação. Repare que a cada dia eu divido o valor de fechamento do IBOV pelo valor da sua curva interpolada, só que essa curva foi interpolada com base em todos os dados do IBOV até 2010. Mas antes dessa data eu não teria esses dados e, portanto não teria essa curva. Essa simulação nada mais fez do que pegar dados passados e otimizar dentro de um determinado modelo.

Novo experimento

Para analisar essa estratégia sem esse erro será necessário ter uma referência usando os dados até um determinado momento apenas. Ou seja, se eu estou em 23/06/2007, eu só posso usar os dados que possuo até hoje, então a minha interpolação deverá ser feita até hoje e atualizada dia após dia, conforme eu recebo novas informações.

Ela continuará a ser feita com uma função exponencial, mas agora os seus parâmetros serão ajustados ao final de cada dia, todo dia. De maneira que ao final de cada dia teremos um valor de referência (curva interpolada) que nos dará o melhor valor até então. A nova curva fica assim:

Antes de fazer uma nova simulação, vamos ver se os dados nos apontam para algum lugar.

Análise

Primeiro vamos ver se existe alguma relação entre a variação do preço do dia seguinte (D+1) e com a nossa razão A/B (preço de fechamento hoje / preço fechamento de referência):

Análise por coeficiente de regressão linear (R): R < 1%, parece que não.

Vamos ainda usar esses dois valores (var D+1, A/B) e calcular a variação média de “var D+1” para dentro de certos intervalos de A/B. A média será calculada usando média geométrica.

intervalo de A/B


<

0.7

0.36%

0.7

0.8

0.02%

0.8

0.9

-0.22%

0.9

1

-0.09%

1

1.1

0.14%

1.1

1.2

0.00%

1.2

1.3

0.26%

1.3

1.4

0.09%

1.4

>

-0.01%

Também não há nenhum padrão identificável nessa tabela. Se houvesse tendência de reversão à média do IBOV ele deveria apresentar valores claramente decrescentes nessa tabela.

Para satisfação de curiosidade vamos ver qual seria o ganho obtido com o novo modelo de referência usando a simulação feita no começo do artigo.

PC\PV

1.1

1.2

1.3

1.4

0.6

0 / 7

0.32 / 6

1.15 / 6

2.94 / 6

0.7

0 / 6

0 / 6

0 / 6

0.51 / 6

0.8

0 / 9

0 / 8

0 / 6

0 / 6

0.9

0 / 9

0 / 8

0 / 6

0 / 6

* Os campos onde aparece ganho = 0 significam que se teria perdido todo o dinheiro, isso aconteceria em qualquer momento onde se ficasse vendido enquanto o preço dobrasse.

Conclusão

O que aprendemos com tudo isso? Que muitos números e gráficos fazem a cabeça doer? Também, mas o principal é que é necessário muito cuidado quando se for analisar determinada estratégia de operação baseada em simulação com dados passados. O cuidado deve ser empregado em se usar dados apenas quando estes apareceram no tempo, fazer simulações usando um parâmetro que foi otimizado em toda a escala temporal e depois aplicado numa simulação regressiva tem um nome: Otimização.

Otimização é ótima quando se está brincando com algum experimento teórico e se quer ver números gigantescos, mas é extremamente perigosa quando se procura por parâmetros de operação que serão usados no presente. Se for simular uma operação da data X até data X+n, verifique se em qualquer data intermediária você está usando apenas dados existentes até então!

Bruno Peruchi

Dúvidas, críticas e sugestões: bruno.peruchi@hotmail.com


Artigo publicado originalmente no Monitor Investimentos

Nenhum comentário: