Moving Average Arma Model


Modelos ARMA (p, q) Modelos para a Análise de Séries Temporais - Parte 2 Na Parte 1 consideramos o modelo Autoregressivo de ordem p, também conhecido como modelo AR (p). Nós o introduzimos como uma extensão do modelo de caminhada aleatória, numa tentativa de explicar a correlação serial adicional em séries de tempo financeiras. Finalmente percebemos que não era suficientemente flexível para capturar verdadeiramente toda a autocorrelação nos preços de fechamento da Amazon Inc. (AMZN) e do SampP500 US Equity Index. A principal razão para isso é que ambos os ativos são condicionalmente heteroskedastic. O que significa que eles são não-estacionários e têm períodos de variância variável ou agrupamento de volatilidade, o que não é levado em conta pelo modelo AR (p). Em futuros artigos, acabaremos construindo os modelos ARREM (Intelligent Moving Average), bem como os modelos condicionalmente heterocedasti - cos das famílias ARCH e GARCH. Esses modelos nos fornecerão nossas primeiras tentativas realistas de prever os preços dos ativos. Neste artigo, no entanto, vamos introduzir a média móvel de ordem q modelo, conhecido como MA (q). Este é um componente do modelo ARMA mais geral e, como tal, precisamos entendê-lo antes de avançar. Eu recomendo que você leia os artigos anteriores na coleção de Análise de Série de Tempo se você não tiver feito isso. Todos podem ser encontrados aqui. Modelos de Ordem Mínima (MA) de ordem q Um modelo de Média Móvel é semelhante a um modelo Autoregressivo, exceto que em vez de ser uma combinação linear de valores de séries temporais passadas, é uma combinação linear dos últimos termos de ruído branco. Intuitivamente, isso significa que o modelo MA vê tais choques de ruído branco aleatório diretamente em cada valor atual do modelo. Isto contrasta com um modelo AR (p), onde os choques de ruído branco são vistos apenas indiretamente. Via regressão em termos anteriores da série. Uma diferença chave é que o modelo MA só verá os últimos q choques para qualquer modelo MA (q) particular, enquanto que o modelo AR (p) terá todos os choques anteriores em conta, embora de uma forma decrescentemente fraca. Definição Matematicamente, o MA (q) é um modelo de regressão linear e é similarmente estruturado para AR (p): Modelo Médio de Ordem q Um modelo de séries temporais, é um modelo de média móvel de ordem q. MA (q), se: begin xt wt beta1 w ldots betaq w final Onde está o ruído branco com E (wt) 0 e variância sigma2. Se considerarmos o operador de mudança de marcha para trás. (Veja um artigo anterior), então podemos reescrever o acima como uma função phi de: begin xt (1 beta1 beta2 2 ldots betaq q) wt phiq () wt end Nós faremos uso da função phi em artigos posteriores. Propriedades de Segunda Ordem Como com AR (p) a média de um processo MA (q) é zero. Isso é fácil de ver como a média é simplesmente uma soma de meios de ruído branco termos, que são todos eles mesmos zero. Começar o texto enspace mux E (xt) sum E (wi) 0 fim começar texto enspace sigma2w (1 beta21 ldots beta2q) end texto enspace rhok esquerda 1 texto enspace k 0 sum betai beta / sumq beta2i texto enspace k 1, ldots, q 0 Texto enspace k gt q fim direito. Onde beta0 1. Agora vamos gerar alguns dados simulados e usá-lo para criar correlogramas. Isso fará com que a fórmula acima para rhok um pouco mais concreto. Simulações e Correlogramas Vamos começar com um processo MA (1). Se definimos beta1 0.6 obtemos o seguinte modelo: Como nos modelos AR (p) no artigo anterior, podemos usar R para simular tal série e então plotar o correlograma. Desde weve tinha um monte de prática na série de artigo anterior série de análise de série de realização de lotes, vou escrever o código R em pleno, em vez de dividi-lo: A saída é a seguinte: Como vimos acima na fórmula para rhok , Para k gt q, todas as autocorrelações devem ser zero. Uma vez que q 1, devemos ver um pico significativo em k1 e, em seguida, picos insignificantes subsequentes a isso. No entanto, devido ao viés de amostragem, deve-se esperar 5 picos (marginalmente) significativos num gráfico de autocorrelação da amostra. Isto é precisamente o que o correlograma nos mostra neste caso. Temos um pico significativo em k1 e então picos insignificantes para k gt 1, exceto em k4 onde temos um pico marginalmente significativo. De fato, esta é uma maneira útil de ver se um modelo de MA (q) é apropriado. Analisando o correlograma de uma série particular, podemos ver quantos atrasos sequenciais não nulos existem. Se q tais defasagens existem, então podemos legitimamente tentar ajustar um modelo MA (q) a uma série particular. Já que temos evidências de nossos dados simulados de um processo MA (1), agora vamos tentar e ajustar um modelo MA (1) para os nossos dados simulados. Infelizmente, não existe um comando ma equivalente ao comando ar de modelo autorregresivo em R. Em vez disso, devemos usar o comando arima mais geral e definir os componentes auto-regressivos e integrados como zero. Fazemos isso criando um 3-vetor e definindo os dois primeiros componentes (os parâmetros autogressivos e integrados, respectivamente) a zero: Recebemos alguma saída útil do comando arima. Em primeiro lugar, podemos ver que o parâmetro foi estimado como hat 0.602, que é muito próximo ao verdadeiro valor de beta1 0.6. Em segundo lugar, os erros-padrão já estão calculados para nós, tornando-se fácil calcular intervalos de confiança. Em terceiro lugar, recebemos uma variância estimada, log-verossimilhança e critério de informação Akaike (necessário para a comparação de modelos). A principal diferença entre arima e ar é que a arima estima um termo de interceptação porque não subtrai o valor médio da série. Portanto, precisamos ter cuidado ao realizar as previsões usando o comando arima. Bem, volte a este ponto mais tarde. Como uma verificação rápida estavam indo para calcular os intervalos de confiança para hat: Podemos ver que o intervalo de confiança 95 contém o valor do parâmetro verdadeiro de beta1 0,6 e assim podemos julgar o modelo um bom ajuste. Obviamente isso deve ser esperado desde que nós simulamos os dados em primeiro lugar Como as coisas mudam se modificarmos o sinal de beta1 para -0.6 Vamos realizar a mesma análise: A saída é a seguinte: Podemos ver que em k1 temos um significado Pico no correlograma, exceto que ele mostra correlação negativa, como wed esperar de um MA (1) modelo com primeiro coeficiente negativo. Mais uma vez todos os picos além de k1 são insignificantes. Vamos ajustar um modelo MA (1) e estimar o parâmetro: hat -0.730, que é uma pequena subestimação de beta1 -0.6. Finalmente, vamos calcular o intervalo de confiança: Podemos ver que o valor do parâmetro verdadeiro de beta1-0.6 está contido dentro do intervalo de confiança de 95, fornecendo-nos evidências de um bom ajuste de modelo. Permite executar o mesmo procedimento para um processo MA (3). Desta vez, devemos esperar picos significativos em k em, e picos insignificantes para k gt 3. Vamos usar os seguintes coeficientes: beta1 0,6, beta2 0,4 e beta3 0,2. Vamos simular um processo MA (3) a partir deste modelo. Ive aumentou o número de amostras aleatórias para 1000 nesta simulação, o que torna mais fácil ver a verdadeira estrutura de autocorrelação, à custa de tornar a série original mais difícil de interpretar: A saída é a seguinte: Como esperado, os três primeiros picos são significativos . No entanto, assim é o quarto. Mas podemos legitimamente sugerir que isso pode ser devido ao viés de amostragem como esperamos ver 5 dos picos sendo significativo para além de kq. Vamos agora ajustar um modelo MA (3) aos dados para tentar estimar parâmetros: As estimativas hat 0.544, hat 0.345 e hat 0.298 estão perto dos valores verdadeiros de beta10.6, beta20.4 e beta30.3, respectivamente. Podemos também produzir intervalos de confiança usando os respectivos erros padrão: Em cada caso, os 95 intervalos de confiança contêm o verdadeiro valor do parâmetro e podemos concluir que temos um bom ajuste com o nosso modelo MA (3), como seria de se esperar. Dados Financeiros Na Parte 1 consideramos a Amazon Inc. (AMZN) e o SampP500 US Equity Index. Nós ajustamos o modelo AR (p) a ambos e descobrimos que o modelo foi incapaz de capturar efetivamente a complexidade da correlação serial, especialmente no elenco do SampP500, onde os efeitos de memória longa parecem estar presentes. Eu não vou traçar os gráficos novamente para os preços e autocorrelação, em vez disso eu vou encaminhá-lo para o post anterior. Amazon Inc. (AMZN) Vamos começar por tentar ajustar uma seleção de MA (q) modelos para AMZN, ou seja, com q em. Como na Parte 1, bem use quantmod para baixar os preços diários para AMZN e depois convertê-los em um log retorna fluxo de preços de fechamento: Agora que temos o log retorna fluxo podemos usar o comando arima para caber MA (1), MA (2) e MA (3) modelos e, em seguida, estimar os parâmetros de cada um. Para MA (1) temos: Podemos traçar os resíduos dos retornos do registro diário e do modelo ajustado: Observe que temos alguns picos significativos nos retornos k2, k11, k16 e k18, indicando que o modelo MA (1) é Improvável de ser um bom ajuste para o comportamento do log AMZN retorna, uma vez que isso não se parece com uma realização de ruído branco. Vamos tentar um modelo MA (2): Ambas as estimativas para os coeficientes beta são negativas. Vamos plotar os resíduos uma vez mais: Podemos ver que há quase zero autocorrelação nos primeiros poucos retornos. No entanto, temos cinco picos marginalmente significativos nos retornos k12, k16, k19, k25 e k27. Isto é sugestivo que o modelo MA (2) está a capturar uma grande parte da autocorrelação, mas não todos os efeitos de memória longa. Como sobre um modelo de MA (3) Uma vez mais, podemos traçar os resíduos: O gráfico de MA (3) residuais parece quase idêntico ao do modelo MA (2). Isso não é surpreendente, assim como a adição de um novo parâmetro a um modelo que aparentemente explicou muitas das correlações em defasagens mais curtas, mas isso não terá muito efeito sobre os atrasos de longo prazo. Toda esta evidência é sugestiva do fato de que um modelo de MA (q) é improvável que seja útil para explicar toda a correlação serial isoladamente. Pelo menos para AMZN. SampP500 Se você se lembrar, na Parte 1 vimos que a primeira ordem diferenciada log diário retorna estrutura do SampP500 possuía muitos picos significativos em vários desfasamentos, tanto curto como longo. Isto proporcionou evidências de heterocedasticidade condicional (isto é, agrupamento de volatilidade) e efeitos de memória longa. Conclui-se que o modelo AR (p) foi insuficiente para captar toda a autocorrelação presente. Como vimos acima, o modelo de MA (q) foi insuficiente para capturar uma correlação serial adicional nos resíduos do modelo ajustado para a série de preços de log diária diferenciada de primeira ordem. Vamos agora tentar ajustar o modelo MA (q) ao SampP500. Pode-se perguntar por que estamos fazendo isso é se sabemos que é improvável que seja um bom ajuste. Essa é uma boa pergunta. A resposta é que precisamos ver exatamente como ele não é um bom ajuste, porque este é o processo final que estaremos seguindo quando nos depararmos com modelos muito mais sofisticados, que são potencialmente mais difíceis de interpretar. Vamos começar por obter os dados e convertê-lo para uma série de primeira ordem diferenciada de logaritmicamente transformado preços de fechamento diário como no artigo anterior: Agora vamos ajustar um modelo MA (1), MA (2) e MA (3) para A série, como fizemos acima para AMZN. Vamos começar com MA (1): Vamos fazer um gráfico dos resíduos deste modelo ajustado: O primeiro pico significativo ocorre em k2, mas há muitos mais em k em. Isto claramente não é uma percepção de ruído branco e por isso devemos rejeitar o modelo MA (1) como um potencial bom ajuste para o SampP500. A situação melhora com MA (2) Mais uma vez, vamos fazer um gráfico dos resíduos deste modelo ajustado MA (2): Enquanto o pico em k2 desapareceu (como wed esperar), ainda estamos com os picos significativos em Muitos atrasos mais longos nos resíduos. Mais uma vez, encontramos o modelo MA (2) não é um bom ajuste. Devemos esperar, para o modelo MA (3), ver menos correlação serial em k3 do que para o MA (2), mas mais uma vez também devemos esperar nenhuma redução em defasagens adicionais. Finalmente, fazemos um gráfico dos resíduos deste modelo ajustado MA (3): Isto é precisamente o que vemos no correlograma dos resíduos. Daí o MA (3), como com os outros modelos acima, não é um bom ajuste para o SampP500. Próximas Etapas Examinamos agora em detalhe dois grandes modelos de séries temporais, a saber, o modelo Autogressivo de ordem p, AR (p) e então Média Móvel de ordem q, MA (q). Nós vimos que eles são ambos capazes de explicar algumas das autocorrelações nos resíduos de primeira ordem diferenciados diariamente log preços de ações e índices, mas volatilidade clusterização e memória longa efeitos persistem. É finalmente o momento de voltar nossa atenção para a combinação destes dois modelos, ou seja, a Média Móvel Autoresgressiva de ordem p, q, ARMA (p, q) para ver se ela vai melhorar a situação ainda mais. No entanto, teremos que esperar até o próximo artigo para uma discussão completa Clique abaixo para saber mais sobre. A informação contida neste site é a opinião dos autores individuais com base em sua observação pessoal, pesquisa e anos de experiência. O editor e seus autores não são conselheiros de investimentos, advogados, CPAs ou outros profissionais de serviços financeiros registrados e não prestam serviços de consultoria jurídica, tributária, contábil, de investimento ou outros serviços profissionais. As informações oferecidas por este site são apenas educação geral. Porque cada situação factual dos indivíduos é diferente o leitor deve procurar seu próprio conselheiro pessoal. Nem o autor nem o editor assumem qualquer responsabilidade por quaisquer erros ou omissões e não têm responsabilidade nem responsabilidade perante qualquer pessoa ou entidade em relação a danos causados ​​ou alegadamente causados ​​directa ou indirectamente pelas informações contidas neste site. Use por sua conta e risco. Além disso, este site pode receber compensação financeira das empresas mencionadas através de publicidade, programas afiliados ou de outra forma. As tarifas e ofertas dos anunciantes mostrados neste website mudam com freqüência, às vezes sem aviso prévio. Enquanto nos esforçamos para manter informações precisas e oportunas, os detalhes da oferta podem estar desatualizados. Os visitantes devem assim verificar os termos de tais ofertas antes de participar neles. O autor e seu editor não se responsabilizam por atualizar informações e renunciarem a responsabilidade por conteúdo, produtos e serviços de terceiros, inclusive quando acessados ​​por meio de hiperlinks e / ou anúncios neste site. Modelos ARMA (p, q) - Parte 3 Este é o terceiro e último post da mini-série sobre modelos de média móvel auto-regressiva (ARMA) para análise de séries temporais. Weve introduziu modelos Autoregressive e modelos de média móvel nos dois artigos anteriores. Agora é hora de combiná-los para produzir um modelo mais sofisticado. Em última análise, isso nos levará aos modelos ARIMA e GARCH que nos permitirão prever os retornos dos ativos e prever a volatilidade. Estes modelos constituirão a base para a negociação de sinais e técnicas de gestão de risco. Se você leu Parte 1 e Parte 2 você terá visto que tendemos a seguir um padrão para a nossa análise de um modelo de série de tempo. III repeti-lo brevemente aqui: Justificativa - Por que estamos interessados ​​neste modelo específico Definição - Uma definição matemática para reduzir a ambigüidade. Correlograma - Traçar um correlograma de amostra para visualizar o comportamento de um modelo. Simulação e Montagem - Ajustar o modelo a simulações, para garantir que entendemos o modelo corretamente. Dados financeiros reais - Aplicar o modelo aos preços dos ativos reais reais. Previsão - Previsão de valores subseqüentes para construir sinais de negociação ou filtros. Para seguir este artigo, é aconselhável dar uma olhada nos artigos anteriores sobre análise de séries temporais. Todos podem ser encontrados aqui. Critério Bayesiano de Informações Na Parte 1 deste artigo, analisamos o Critério de Informação Akaike (AIC) como um meio de nos ajudar a escolher entre os melhores modelos de séries temporais. Uma ferramenta estreitamente relacionada é o critério Bayesiano de Informação (BIC). Essencialmente, tem comportamento semelhante ao AIC, pois penaliza os modelos por terem muitos parâmetros. Isso pode levar a superalimentação. A diferença entre o BIC eo AIC é que o BIC é mais rigoroso com a sua penalização de parâmetros adicionais. Critério Bayesiano de Informações Se tomarmos a função de verossimilhança para um modelo estatístico, que tenha k parâmetros, e L maximize a probabilidade. Então o critério Bayesiano de Informação é dado por: Onde n é o número de pontos de dados na série temporal. Estaremos usando o AIC eo BIC abaixo ao escolher modelos ARMA (p, q) apropriados. Ljung-Box Test Na Parte 1 deste artigo, Rajan mencionou nos comentários de Disqus que o teste de Ljung-Box era mais apropriado do que usar o Critério de Informação Akaike do Critério de Informação Bayesiano para decidir se um modelo ARMA era um bom ajuste para um tempo série. O teste de Ljung-Box é um teste de hipóteses clássico que é projetado para testar se um conjunto de autocorrelações de um modelo de séries temporais ajustadas diferem significativamente de zero. O teste não testa cada atraso individual para aleatoriedade, mas sim testa a aleatoriedade sobre um grupo de defasagens. Teste de Ljung-Box Definimos a hipótese nula como: Os dados da série de tempo em cada lag são i. i.d .. ou seja, as correlações entre os valores da série de população são zero. Definimos a hipótese alternativa como: Os dados da série de tempo não são i. i.d. E possuem correlação serial. Calculamos a seguinte estatística de teste. Q: Onde n é o comprimento da amostra de séries temporais, chapéu k é a autocorrelação da amostra com atraso k e h é o número de defasagens no teste. A regra de decisão sobre se rejeitar a hipótese nula é verificar se Q gt chi2, para uma distribuição qui-quadrado com h graus de liberdade no percentil 100 (1-alfa). Embora os detalhes do teste possam parecer um pouco complexos, podemos de fato usar R para calcular o teste para nós, simplificando um pouco o procedimento. Agora que discutimos o BIC e o teste de Ljung-Box, estávamos prontos para discutir o nosso primeiro modelo misto, ou seja, a Média Móvel Autoresgressiva de ordem p, q ou ARMA (p, Q). Até o momento, consideramos processos autorregressivos e processos de média móvel. O modelo anterior considera seu próprio comportamento passado como insumos para o modelo e, como tal, tenta capturar efeitos de participantes no mercado, como momentum e reversão média na negociação de ações. O último modelo é usado para caracterizar informações de choque em uma série, como um anúncio de ganhos surpresa ou evento inesperado (como o derramamento de óleo BP Deepwater Horizon). Assim, um modelo ARMA tenta capturar ambos os aspectos ao modelar séries de tempo financeiro. Observe que um modelo ARMA não leva em conta o agrupamento de volatilidade, um fenômeno empírico-chave de muitas séries de tempo financeiro. Não é um modelo condicionalmente heteroscedástico. Para isso teremos de esperar pelos modelos ARCH e GARCH. Definição O modelo ARMA (p, q) é uma combinação linear de dois modelos lineares e, portanto, é ainda linear: Modelo de ordem temporal p, q Um modelo de série temporal, é um modelo de média móvel autorregressiva de ordem p, q . Onde está o ruído branco com E (wt) 0 e variância sigma2. Onde está o ruído branco com E (wt) 0 e variância sigma2. Se considerarmos o operador de mudança de marcha para trás. (Veja um artigo anterior), então podemos reescrever o acima como uma função theta e phi de: Podemos ver diretamente que, ao definir p neq 0 e q0, recuperamos o modelo AR (p). Da mesma forma, se definimos p 0 e q neq 0, recuperamos o modelo MA (q). Uma das principais características do modelo ARMA é que ele é parcimonioso e redundante em seus parâmetros. Ou seja, um modelo ARMA, muitas vezes, exigem menos parâmetros do que um modelo AR (p) ou MA (q) sozinho. Além disso, se reescrevemos a equação em termos da BSO, então os polinômios theta e phi podem às vezes compartilhar um fator comum, levando assim a um modelo mais simples. Simulações e Correlogramas Como com os modelos de média autorregressiva e móvel, agora simularemos várias séries ARMA e, em seguida, tentaremos ajustar os modelos ARMA a essas realizações. Nós realizamos isso porque queremos garantir que compreendemos o procedimento de montagem, incluindo como calcular intervalos de confiança para os modelos, bem como garantir que o procedimento realmente recupera estimativas razoáveis ​​para os parâmetros ARMA originais. Na Parte 1 e Parte 2 construímos manualmente as séries AR e MA tirando N amostras de uma distribuição normal e, em seguida, criando o modelo de série temporal específico usando atrasos dessas amostras. No entanto, há uma maneira mais simples de simular AR, MA, ARMA e ARIMA dados, simplesmente usando o método arima. sim em R. Vamos começar com o mais simples possível não trivial ARMA modelo, ou seja, o ARMA (1,1 ) modelo. Ou seja, um modelo autorregressivo de ordem um combinado com um modelo de média móvel de ordem um. Tal modelo tem apenas dois coeficientes, alfa e beta, que representam os primeiros desfasamentos da série de tempo em si e os termos de ruído de choque branco. Esse modelo é dado por: Precisamos especificar os coeficientes antes da simulação. Vamos pegar alpha 0.5 e beta -0.5: A saída é a seguinte: Permite também plotar o correlograma: Podemos ver que não há autocorrelação significativa, o que é esperado de um modelo ARMA (1,1). Finalmente, vamos tentar determinar os coeficientes e seus erros padrão usando a função arima: Podemos calcular os intervalos de confiança para cada parâmetro usando os erros padrão: Os intervalos de confiança contêm os valores dos parâmetros verdadeiros para ambos os casos, no entanto, 95 intervalos de confiança são muito amplos (uma consequência dos erros padrão razoavelmente grandes). Vamos agora tentar um ARMA (2,2) modelo. Ou seja, um modelo AR (2) combinado com um modelo MA (2). Precisamos especificar quatro parâmetros para este modelo: alfa1, alfa2, beta1 e beta2. Vamos pegar alpha1 0.5, alpha2-0.25 beta10.5 e beta2-0.3: A saída do nosso modelo ARMA (2,2) é a seguinte: E a autocorelação correspondente: Agora podemos tentar montar um modelo ARMA (2,2) para Os dados: Também podemos calcular os intervalos de confiança para cada parâmetro: Observe que os intervalos de confiança para os coeficientes para a componente média móvel (beta1 e beta2) não contêm realmente o valor do parâmetro original. Contudo, para fins comerciais, precisamos apenas de um poder preditivo que exceda o acaso e produza lucros suficientes acima dos custos de transação, a fim de ser rentável em termos de custos. A longo prazo. Agora que temos visto alguns exemplos de modelos ARMA simulados, precisamos de um mecanismo para escolher os valores de p e q quando se encaixam nos modelos a dados financeiros reais. Escolhendo o melhor modelo ARMA (p, q) Para determinar qual ordem p, q do modelo ARMA é apropriada para uma série, precisamos usar o AIC (ou BIC) em um subconjunto de valores para p, q e Em seguida, aplicar o teste Ljung-Box para determinar se um bom ajuste foi alcançado, para valores específicos de p, q. Para mostrar este método, vamos primeiro simular um determinado processo ARMA (p, q). Vamos então fazer um loop sobre todos os valores pairwise de p in e q in e calcular o AIC. Vamos selecionar o modelo com o menor AIC e, em seguida, executar um teste Ljung-Box sobre os resíduos para determinar se conseguimos um bom ajuste. Vamos começar simulando uma série ARMA (3,2): Agora vamos criar um objeto final para armazenar o melhor ajuste do modelo eo menor valor AIC. Percorremos as várias combinações p, q e usamos o objeto atual para armazenar o ajuste de um modelo ARMA (i, j), para as variáveis ​​looping i e j. Se o AIC atual for menor do que qualquer AIC previamente calculado, definimos o AIC final para este valor atual e selecionamos essa ordem. Após a terminação do laço, temos a ordem do modelo ARMA armazenado em final. order e o ARIMA (p, d, q) se encaixa (com o componente d integrado definido como 0) armazenado como final. arma: Deixa a saída do AIC , Ordem e coeficientes ARIMA: Podemos ver que a ordem original do modelo ARMA simulado foi recuperada, nomeadamente com p3 e q2. Podemos traçar o corelograma dos resíduos do modelo para ver se eles parecem uma realização de ruído branco discreto (DWN): O corelograma realmente parece uma realização de DWN. Finalmente, realizamos o teste Ljung-Box para 20 lags para confirmar isso: Observe que o valor p é maior que 0,05, o que indica que os resíduos são independentes no nível 95 e, portanto, um modelo ARMA (3,2) fornece um Bom ajuste do modelo. É claro que este deve ser o caso, uma vez que weve simulado os dados nós mesmos No entanto, este é precisamente o procedimento que vamos usar quando chegarmos a ajustar modelos ARMA (p, q) para o índice SampP500 na próxima seção. Dados financeiros Agora que descrevemos o procedimento para escolher o modelo de série temporal ideal para uma série simulada, é bastante simples aplicá-lo aos dados financeiros. Para este exemplo, vamos escolher mais uma vez o SampP500 US Equity Index. Permite fazer o download dos preços de fechamento diários usando o quantmod e, em seguida, criar o fluxo de retorno do log: Permite executar o mesmo procedimento de ajuste que para a série ARMA (3,2) simulada acima no log retorna série do SampP500 usando o AIC: Tem a ordem ARMA (3,3): Permite traçar os resíduos do modelo ajustado para o fluxo de retorno diário do log SampP500: Observe que há alguns picos significativos, especialmente em defasagens maiores. Isto é indicativo de um ajuste pobre. Vamos realizar um teste de Ljung-Box para ver se temos evidências estatísticas para isso: Como nós suspeitamos, o valor p é menor que 0,05 e, como tal, não podemos dizer que os resíduos são uma realização de ruído branco discreto. Portanto, há autocorrelação adicional nos resíduos que não é explicada pelo modelo ARMA (3,3) ajustado. Próximas Etapas Como discutimos ao longo desta série de artigos, vimos evidências de heterocedasticidade condicional (agrupamento de volatilidade) na série SampP500, especialmente nos períodos em torno de 2007-2008. Quando usamos um modelo GARCH mais adiante na série de artigos, veremos como eliminar essas autocorrelações. Na prática, os modelos ARMA nunca são geralmente bons ajustes para retorno de ações log. Precisamos levar em conta a heterocedasticidade condicional e usar uma combinação de ARIMA e GARCH. O próximo artigo irá considerar ARIMA e mostrar como o componente integrado difere do modelo ARMA que temos considerado neste artigo. Clique abaixo para saber mais sobre. A informação contida neste site é a opinião dos autores individuais com base em sua observação pessoal, pesquisa e anos de experiência. O editor e seus autores não são conselheiros de investimentos, advogados, CPAs ou outros profissionais de serviços financeiros registrados e não prestam serviços de consultoria jurídica, tributária, contábil, de investimento ou outros serviços profissionais. As informações oferecidas por este site são apenas educação geral. Porque cada situação factual dos indivíduos é diferente o leitor deve procurar seu próprio conselheiro pessoal. Nem o autor nem o editor assumem qualquer responsabilidade por quaisquer erros ou omissões e não têm responsabilidade nem responsabilidade perante qualquer pessoa ou entidade em relação a danos causados ​​ou alegadamente causados ​​directa ou indirectamente pelas informações contidas neste site. Use por sua conta e risco. Além disso, este site pode receber compensação financeira das empresas mencionadas através de publicidade, programas afiliados ou de outra forma. As tarifas e ofertas dos anunciantes mostrados neste website mudam com freqüência, às vezes sem aviso prévio. Enquanto nos esforçamos para manter informações precisas e oportunas, os detalhes da oferta podem estar desatualizados. Os visitantes devem assim verificar os termos de tais ofertas antes de participar neles. O autor e seu editor não se responsabilizam por atualizar informações e renunciarem a responsabilidade por conteúdo, produtos e serviços de terceiros, inclusive quando acessados ​​por meio de hiperlinks e / ou anúncios neste site.2.1 Modelos de média móvel (modelos MA) Modelos de séries temporais conhecidos como ARIMA Modelos podem incluir termos autorregressivos e / ou termos de média móvel. Na Semana 1, aprendemos um termo autorregressivo em um modelo de série temporal para a variável x t é um valor retardado de x t. Por exemplo, um termo autorregressivo de atraso 1 é x t-1 (multiplicado por um coeficiente). Esta lição define termos de média móvel. Um termo de média móvel num modelo de séries temporais é um erro passado (multiplicado por um coeficiente). Vamos (wt overset N (0, sigma2w)), significando que os w t são identicamente, distribuídos independentemente, cada um com uma distribuição normal com média 0 e a mesma variância. O modelo de média móvel da 1ª ordem, denotado por MA (1) é (xt mu wt theta1w) O modelo de média móvel de 2ª ordem, denotado por MA (2) é (xt mu wt theta1w theta2w) , Denotado por MA (q) é (xt mu wt theta1w theta2w pontos thetaqw) Nota. Muitos livros didáticos e programas de software definem o modelo com sinais negativos antes dos termos. Isso não altera as propriedades teóricas gerais do modelo, embora ele inverta os sinais algébricos de valores de coeficientes estimados e de termos (não-quadrados) nas fórmulas para ACFs e variâncias. Você precisa verificar o software para verificar se sinais negativos ou positivos foram utilizados para escrever corretamente o modelo estimado. R usa sinais positivos em seu modelo subjacente, como fazemos aqui. Propriedades Teóricas de uma Série de Tempo com um Modelo MA (1) Observe que o único valor não nulo na ACF teórica é para o atraso 1. Todas as outras autocorrelações são 0. Assim, uma ACF de amostra com uma autocorrelação significativa apenas no intervalo 1 é um indicador de um possível modelo MA (1). Para os estudantes interessados, provas destas propriedades são um apêndice a este folheto. Exemplo 1 Suponha que um modelo MA (1) seja x t 10 w t .7 w t-1. Onde (wt overset N (0,1)). Assim, o coeficiente 1 0,7. O ACF teórico é dado por Um gráfico deste ACF segue. O gráfico apenas mostrado é o ACF teórico para um MA (1) com 1 0,7. Na prática, uma amostra normalmente não proporciona um padrão tão claro. Usando R, simulamos n 100 valores de amostra usando o modelo x t 10 w t .7 w t-1 onde w t iid N (0,1). Para esta simulação, segue-se um gráfico de séries temporais dos dados da amostra. Não podemos dizer muito desse enredo. A ACF de amostra para os dados simulados segue. Observa-se que a amostra ACF não corresponde ao padrão teórico do MA subjacente (1), ou seja, que todas as autocorrelações para os atrasos de 1 serão 0 Uma amostra diferente teria uma ACF de amostra ligeiramente diferente mostrada abaixo, mas provavelmente teria as mesmas características gerais. Propriedades teóricas de uma série temporal com um modelo MA (2) Para o modelo MA (2), as propriedades teóricas são as seguintes: Note que os únicos valores não nulos na ACF teórica são para os retornos 1 e 2. As autocorrelações para atrasos maiores são 0 . Assim, uma ACF de amostra com autocorrelações significativas nos intervalos 1 e 2, mas autocorrelações não significativas para atrasos maiores indica um possível modelo MA (2). Iid N (0,1). Os coeficientes são 1 0,5 e 2 0,3. Como este é um MA (2), o ACF teórico terá valores não nulos apenas nos intervalos 1 e 2. Valores das duas autocorrelações não nulas são Um gráfico do ACF teórico segue. Como quase sempre é o caso, dados de exemplo não vai se comportar tão perfeitamente como a teoria. Foram simulados n 150 valores de amostra para o modelo x t 10 w t .5 w t-1 .3 w t-2. Onde w t iid N (0,1). O gráfico da série de tempo dos dados segue. Como com o gráfico de série de tempo para os dados de amostra de MA (1), você não pode dizer muito dele. A ACF de amostra para os dados simulados segue. O padrão é típico para situações em que um modelo MA (2) pode ser útil. Existem dois picos estatisticamente significativos nos intervalos 1 e 2, seguidos por valores não significativos para outros desfasamentos. Note que devido ao erro de amostragem, o ACF de amostra não corresponde exactamente ao padrão teórico. ACF para modelos MA (q) gerais Uma propriedade dos modelos MA (q) em geral é que existem autocorrelações não nulas para os primeiros q lags e autocorrelações 0 para todos os retornos gt q. Não-unicidade de conexão entre os valores de 1 e (rho1) no modelo MA (1). No modelo MA (1), para qualquer valor de 1. O 1/1 recíproco dá o mesmo valor para Como exemplo, use 0,5 para 1. E então use 1 / (0,5) 2 para 1. Você obterá (rho1) 0,4 em ambas as instâncias. Para satisfazer uma restrição teórica chamada invertibilidade. Nós restringimos os modelos MA (1) para ter valores com valor absoluto menor que 1. No exemplo dado, 1 0,5 será um valor de parâmetro permitido, enquanto que 1 1 / 0,5 2 não. Invertibilidade de modelos MA Um modelo MA é dito ser inversível se for algébrica equivalente a um modelo de ordem infinita convergente. Por convergência, queremos dizer que os coeficientes de AR diminuem para 0 à medida que avançamos no tempo. Invertibilidade é uma restrição programada em séries temporais de software utilizado para estimar os coeficientes de modelos com MA termos. Não é algo que verificamos na análise de dados. Informações adicionais sobre a restrição de invertibilidade para modelos MA (1) são fornecidas no apêndice. Teoria Avançada Nota. Para um modelo MA (q) com um ACF especificado, existe apenas um modelo invertible. A condição necessária para a invertibilidade é que os coeficientes têm valores tais que a equação 1- 1 y-. - q y q 0 tem soluções para y que caem fora do círculo unitário. Código R para os Exemplos No Exemplo 1, traçamos o ACF teórico do modelo x t 10w t. 7w t-1. E depois simularam n 150 valores deste modelo e traçaram a série temporal da amostra e a amostra ACF para os dados simulados. Os comandos R utilizados para traçar o ACF teórico foram: acfma1ARMAacf (mac (0,7), lag. max10) 10 atrasos de ACF para MA (1) com theta1 0,7 lags0: 10 cria uma variável chamada atrasos que varia de 0 a 10. trama (Hg) adiciona um eixo horizontal ao gráfico O primeiro comando determina o ACF e o armazena em um objeto (a0) Chamado acfma1 (nossa escolha de nome). O comando de plotagem (o terceiro comando) traça defasagens em relação aos valores de ACF para os retornos 1 a 10. O parâmetro ylab rotula o eixo y eo parâmetro principal coloca um título no gráfico. Para ver os valores numéricos do ACF basta usar o comando acfma1. A simulação e as parcelas foram feitas com os seguintes comandos. Xcarima. sim (n150, lista (mac (0.7))) Simula n 150 valores de MA (1) xxc10 adiciona 10 para fazer média 10. Padrão de simulação significa 0. plot (x, typeb, mainSimulated MA (1) dados) Acf (x, xlimc (1,10), mainACF para dados de amostras simulados) No Exemplo 2, traçamos o ACF teórico do modelo xt 10 wt. 5 w t-1 .3 w t-2. E depois simularam n 150 valores deste modelo e traçaram a série temporal da amostra e a amostra ACF para os dados simulados. Os comandos R utilizados foram acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 parcela (atrasos, acfma2, xlimc (1,10), ylabr, tipoh, ACF principal para MA (2) com theta1 0,5, (X, typeb, principal série MA (2) simulada) acf (x, xlimc (1,10), x2) MainACF para dados simulados de MA (2) Apêndice: Prova de Propriedades de MA (1) Para estudantes interessados, aqui estão as provas para propriedades teóricas do modelo MA (1). Quando h 1, a expressão anterior 1 w 2. Para qualquer h 2, a expressão anterior 0 (x) é a expressão anterior x (x) A razão é que, por definição de independência do wt. E (w k w j) 0 para qualquer k j. Além disso, porque w t tem média 0, E (w j w j) E (w j 2) w 2. Para uma série de tempo, aplique este resultado para obter o ACF fornecido acima. Um modelo inversível MA é aquele que pode ser escrito como um modelo de ordem infinita AR que converge para que os coeficientes AR convergem para 0 como nos movemos infinitamente no tempo. Bem demonstrar invertibilidade para o modelo MA (1). Em seguida, substituimos a relação (2) para wt-1 na equação (1) (3) (zt wt theta1 (z-theta1w) wt theta1z-theta2w) No tempo t-2. A equação (2) torna-se Então substituimos a relação (4) para wt-2 na equação (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z-theta12z theta31w) Se continuássemos Infinitamente), obteríamos o modelo AR de ordem infinita (zt wt theta1 z - theta21z theta31z - theta41z dots) Observe, no entanto, que se 1 1, os coeficientes multiplicando os desfasamentos de z aumentarão (infinitamente) em tamanho à medida que retrocedermos Tempo. Para evitar isso, precisamos de 1 lt1. Esta é a condição para um modelo MA (1) invertido. Infinite Order MA model Na semana 3, bem ver que um modelo AR (1) pode ser convertido em um modelo de ordem infinita MA: (xt - mu wt phi1w phi21w pontos phik1 w dots sum phij1w) Esta soma de termos de ruído branco passado é conhecido Como a representação causal de um AR (1). Em outras palavras, x t é um tipo especial de MA com um número infinito de termos remontando no tempo. Isso é chamado de ordem infinita MA ou MA (). Uma ordem finita MA é uma ordem infinita AR e qualquer ordem finita AR é uma ordem infinita MA. Lembre-se na Semana 1, observamos que uma exigência para um AR estacionário (1) é que 1 lt1. Vamos calcular o Var (x t) usando a representação causal. Esta última etapa usa um fato básico sobre séries geométricas que requer (phi1lt1) caso contrário, a série diverge. Navegação

Comments