Modelagem de Séries Temporais para o Custo da Cesta Básica, na Cidade de Belém do Pará, Via Metodologia de Box e Jenkins
Por Waldeci do Nascimento Azulay | 03/05/2010 | EconomiaWaldeci do Nascimento Azulay
Resumo
O objetivo deste trabalho é analisar o comportamento do custo da cesta básica na cidade de Belém do Pará ao longo do período de janeiro de
Palavras Chaves: Cesta Básica; Metodologia de Box e Jenkins; Séries Temporais.
1. Introdução
Os alimentos são elementos essenciais para a sobrevivência do ser humano. Dentre eles destacam-se: carne, leite, feijão arroz, farinha de trigo/mandioca, batata, tomate, pão, café, banana, açúcar, óleo e manteiga que compõem a cesta básica. No Brasil, o Departamento Intersindical de Estatísticas e Estudos Socioeconômicos é o órgão responsável em coletar informações que permitam estimar o valor da cesta básica dentro de um período de tempo e a partir daí realizar estudos sobre o impacto da evolução temporal dos preços na renda do trabalhador.
Do ponto de vista econômico, a evolução dos preços gera a diminuição do poder de compra do salário mínimo, gerando conflitos entre sindicatos e a classe patronal, o DIEESE aparece como um dos intermediadores nas negociações mostrando o comportamento dos preços no tempo e qual o impacto dos aumentos de preços sobre o salário real e consequentemente na quantidade de itens que se pode adquirir com uma determinada renda, quando defasada por aumentos de preços ao longo do tempo.
2. Metodologia Estatística
2.1. Dados
Os dados utilizados neste trabalho são referentes aos custos em reais (R$) da cesta básica comercializada, na cidade de Belém do Pará de janeiro de
2.2. Análise de Séries Temporais
Uma série temporal é uma realização particular de um processo estocástico de uma variável aleatória que evolui e guarda uma estrutura de dependência no tempo, onde o objetivo é modelar esta dependência e transformar a série num ruído branco.
A ferramenta básica para modelar uma série temporal é a função de autocorrelação. A autocorrelação de um processo (série) é uma medida padronizada da dependência linear de lag K, definida por:
A dependência serial é denotada quando:
A autocorrelação estimada de lag K é definida por:
Cujo gráfico é chamado de correlograma e pode ser utilizado para identificar características de uma série temporal.
O objetivo de modelar uma série temporal, consiste em tornar o processo puramente aleatório chamado de ruído branco. Um ruído branco é uma sequência de observações com média e variância constantes e autocorrelações nulas em todos os lags.
Na prática, se uma série temporal exibe uma estrutura de dependência, deve-se achar o melhor modelo matemático que descreva esta dependência serial e a transforme num ruído branco. Para tal, pode-se utilizar a metodologia de Box e Jenkins.
2.2.1. Metodologia de Box e Jenkins
Segundo Morettin e Toloi (2004), uma metodologia bastante utilizada na análise de modelos paramétricos é conhecida como abordagem de Box e Jenkins. A metodologia consiste em ajustar modelos auto-regressivos integrados de médias móveis, ARIMA (p,d,q), a um conjunto de dados.
A estratégia para a construção do modelo adequado representativo da série temporal é baseada em um ciclo iterativo, no qual a escolha da estrutura do modelo é baseada nos próprios dados. Segundo Box & Jenkins (1976), os estágios do ciclo iterativo são:
1. Identificação: consiste em descobrir qual dentre as várias versões dos modelos de Box-Jenkins, sejam eles sazonais ou não, descreve o comportamento da série. A identificação do modelo a ser estimado ocorre pelo comportamento das funções de autocorrelações (ACF) e das funções de autocorrelações parciais (PACF).
Outra proposta de identificação apresentada na literatura de séries temporais, consiste em selecionar o modelo cujo critério de informação acumulada seja mínimo. E um dos critérios mais utilizados é o Critério de Informação de Akaik (AIC) que é dado por:
Onde m é o número de parâmetros (
Onde
2. Estimação: consiste em estimar os parâmetros do componente auto-regressivo, os parâmetros do componente de médias móveis e a variância de et.
3. Verificação: consiste em avaliar se o modelo estimado é adequado para descrever o comportamento dos dados.
Um teste simples do modelo escolhido é ver se os resíduos estimados do modelo são ruídos brancos; se são, podemos aceitar o ajuste específico; se não são, devemos começar tudo de novo. Assim, a metodologia de Box e Jenkins é um processo iterativo.
Dentre os testes de diagnósticos do modelo ajustado a uma série, podemos utilizar o teste de Ljung-Box baseado nas autocorrelações dos resíduos. A estatística teste é definida por:
Sendo
A estatística
Caso o modelo não seja adequado, o ciclo é repetido, voltando-se à fase de identificação. Um procedimento muito utilizado é identificar não só um único modelo, mas alguns modelos que serão então estimados e verificados. Quando se obtém um modelo satisfatório, passa-se para a última etapa da metodologia de Box-Jenkins, que constitui o objetivo principal da metodologia: realizar previsões.
2.2.2.Critério de Validação
Segundo Russo (2002), um dos critérios muito utilizados para escolher o melhor modelo é o critério de Erro Percentual Absoluto Médio de Previsão (MAPE). O MAPE é calculado a partir das previsões um passo à frente gerado por cada modelo estimado.
Onde
3. Análise e Discursão dos Dados
A Tabela 1 apresenta o Resumo Estatístico dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará de Janeiro de
Tabela 1: Resumo Estatístico dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará de Janeiro de
|
|
|
Medidas |
|
Valor |
Média |
|
174,66 |
Mediana |
|
165,14 |
Desvio Padrão |
23,49 |
E como o custo médio é maior que o custo mediano, pode-se dizer que a série apresenta assimetria positiva.
3.2. Metodologia de Box e Jenkins
A Figura 1 apresenta a Evolução Temporal dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de
Figura 1: Evolução Temporal dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de
E que em julho de 2008, atingiu o custo mais alto do período. Atingindo o custo comercial de R$ 211,13, situando-se acima do custo médio do período que foi de R$ 174,66.
A partir da Figura 1, verifica-se também, que os custos da cesta básica não apresentaram forte tendência de crescimento, conforme se pode observar na Tabela 1 que apresenta o Teste de Wald-Wolfowitz para a Verificação de Tendência partindo-se das seguintes hipóteses ao nível de significância de 0,05.
· H0: Não existe tendência, versus
· H1: Existe Tendência.
Tabela 2: Teste de Wald-Wolfowitz Para a Verificação de Tendência dos Custos da Cesta Básica.
|
|
|
Mediana |
Z (Calculado) |
Z (Tabelado) |
165,14 |
0,6098 |
0,2709 |
Nela, verifica-se que o Z calculado igual a 0,6098 é maior que o Z tabelado igual a 0,2709, indicando a não rejeição da hipótese nula ao nível de 0,05% de probabilidade, ou seja, a série é estacionária e não precisa ser diferenciada.
Dada a estacionária da série, as Figuras 2 e 3 apresentam respectivamente, a Função de Autocorrelação e a Função de Autocorrelação Parcial da Série Original dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de
Figuras 2 e 3: Função de Autocorrelação e Função de Autocorrelação Parcial da Série Original dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de
Nelas, verificam-se coeficientes de correlação fora do limite de 95% de confiança, mostrando que os dados da série são autocorrelacionados.
Assim, de acordo com o comportamento da Função de Autocorrelação e da Função de Autocorrelação Parcial da série original foram propostos os seguintes modelos autorregressivos: AR (1) e AR (2), cujos resultados são apresentados na Tabela 3.
A Tabela 3 apresenta os Resultados das Estimativas dos Parâmetros, do Teste t-Student, do Nível descritivo e do Critério AIC dos Modelos AR (1) e AR (2 da Série. Nela, verifica-se que o processo autorregressivo de primeira ordem, AR (1), com
Tabela 3: Resultados das Estimativas dos Parâmetros, do Teste t-Student, do Nível Descritivo e do Critério AIC dos Modelos AR (1) e AR (2) da Série.
|
|
|
|
|
Modelo |
Estimativa dos Parâmetros |
Teste t-Student |
Nível Descritivo |
Critério AIC |
AR (1) |
|
36,23 |
0,000 |
381,8307 |
AR (2) |
|
9,0275 |
0,000 |
381,8712 |
|
-0,1800 |
0,1673 |
A partir da Tabela 1, verifica-se, também, que pelo Critério de Informação AIC, o modelo AR (1) com coeficiente estimado igual a 381,8307, mostrou-se adequado por apresentar menor coeficiente quando comparado com o valor do modelo AR (2) igual a 381,8712.
Assim, considerando os resultados do Teste t-Student e do Coeficiente de Estimação AIC, o processo autorregressivo, AR (1), é o melhor modelo identificado para representar a série.
Analisando a Função de Autocorrelação e Autocorrelação Parcial Estimadas dos Resíduos do Processo AR (1), Figuras 4 e 5, respectivamente. Verifica-se que todas as quinze primeiras autocorrelações se encontram dentro do limite de 95% de confiança, mostrando que o modelo autorregressivo de primeira ordem, AR (1), ajustou adequadamente a série e que os resíduos podem ser considerados ruído branco, indicando que a dinâmica da série estudada pode ser bem explicada pelo coeficiente do modelo ajustado,conforme mostra o Teste de Ljung e Box.
Figura 4 e 5: Função de Autocorrelação e Função de Autocorrelação Parcial Estimada dos Resíduos da Série Original dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de
As hipóteses a serem testadas ao nível de significância de 0,05%, para o Teste de Ljung e Box, são:
H0: Os resíduos são não correlacionados; versus.
H1: Os resíduos são correlacionados.
A Tabela 4 apresenta o Teste de Ljung e Box para as Autocorrelações Estimadas dos Resíduos da Série dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de
Tabela 4: Teste de Ljung e Box para as Autocorrelações Estimadas dos Resíduos da Série dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de
|
|
|
|
|
K |
Autocorrelação |
Erro Padrão |
Teste de Ljung e Box |
Probabilidade |
2 |
-0,0006 |
0,1249 |
0,0000 |
1,0000 |
3 |
-0,0008 |
0,1238 |
0,0001 |
1,0000 |
4 |
-0,0011 |
0,1227 |
0,0002 |
1,0000 |
5 |
-0,0014 |
0,1216 |
0,0003 |
1,0000 |
6 |
-0,0017 |
0,1205 |
0,0005 |
1,0000 |
7 |
-0,0020 |
0,1194 |
0,0008 |
1,0000 |
8 |
-0,0022 |
0,1182 |
0,0011 |
1,0000 |
9 |
-0,0026 |
0,1171 |
0,0016 |
1,0000 |
10 |
-0,0028 |
0,1159 |
0,0022 |
1,0000 |
11 |
-0,0031 |
0,1148 |
0,0029 |
1,0000 |
12 |
-0,0034 |
0,1136 |
0,0038 |
1,0000 |
13 |
-0,0037 |
0,1124 |
0,0049 |
1,0000 |
14 |
-0,0040 |
0,1112 |
0,0062 |
1,0000 |
15 |
-0,0042 |
0,1100 |
0,0076 |
1,0000 |
Nestas condições, o modelo AR (1) pode ser utilizado para fazer previsões de curto prazo do custo da cesta básica na cidade de Belém do Pará, cuja previsão pode ser feita através da seguinte equação:
Onde;
A Tabela 5 apresenta o Sumário do Parâmetro do Modelo AR (1) Ajustado à Série dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de
Nela, verifica-se que o valor predito para o modelo AR (1) no tempo t+1 é dado por:
Tabela 5: Sumário do Parâmetro do Modelo AR (1) Ajustado à Série dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de
|
|
|
Modelo |
Estimativa do Parâmetro |
Média |
AR (1) |
|
176,67 |
A Tabela 6 apresenta os Valores Previstos Para o Custo da Cesta Básica na Cidade de Belém do Pará nos Próximos Três Meses de 2010. Nela, verifica-se que a partir do modelo construído os custos da cesta básica comercializada na cidade de Belém do Pará nos meses de janeiro, fevereiro e março de 2010 situaram-se acima dos custos previstos, conforme pode ser visualizado na Figura 6. O erro médio previsto para o modelo AR (1) é igual a 2,57%.
Tabela 6: Valores Previstos Para o Custo da Cesta Básica na Cidade de Belém do Pará nos Próximos Três Meses de 2010.
|
|
|
|
|
|
|
Mês/Ano |
t |
h |
Zt Observado |
Zt Previsto |
et(h) |
MAPE |
jan/10 |
61 |
1 |
204,62 |
203,61 |
1,01 |
0,005 |
fev/10 |
62 |
2 |
204,93 |
202,92 |
2,01 |
0,010 |
mar/10 |
63 |
3 |
215,72 |
202,25 |
13,47 |
0,062 |
____ Valores Observados _____ Valores Previstos
Figura 6: Gráfico Representativo de Previsões do Custo da Cesta Básica na Cidade de Belém do Pará, Segundo o Modelo AR (1).
4. Conclusão
A partir da análise dos gráficos representativos da série, tabelas e demais cálculos estatísticos, verificou-se que a série é estacionária, o melhor modelo de ajuste é um processo autorregressivo de primeira ordem AR (1), que permite fazer simulações de previsões futuras do custo da cesta básica na cidade de Belém do Pará através da equação:
Referências
MORETTIN, P. A.; TOLOI, C. M. Análise de Séries Temporais, 2. ed., São Paulo: Edgard Blucher, 2006.
RUSSO, S. L. Gráficos de Controle para Variáveis Não-Conformes Autocorrelacionadas. Tese de Doutorado. Programa de Pós-graduação em Engenharia de Produção, UFSC, Florianópolis/SC, 2002.