Monday 16 October 2017

5 Pontos Simples Simétrico Móvel Média


Médias móveis Médias móveis Com conjuntos de dados convencionais, o valor médio é frequentemente o primeiro, e um dos mais úteis, estatísticas de resumo a calcular. Quando os dados estão na forma de uma série temporal, a média da série é uma medida útil, mas não reflete a natureza dinâmica dos dados. Os valores médios calculados em períodos em curto, anteriores ao período atual ou centrados no período atual, são freqüentemente mais úteis. Como esses valores médios variam ou se movem, à medida que o período atual se move a partir do tempo t 2, t 3, etc., eles são conhecidos como médias móveis (Mas). Uma média móvel simples é (tipicamente) a média não ponderada de k valores anteriores. Uma média móvel exponencialmente ponderada é essencialmente a mesma que uma média móvel simples, mas com contribuições para a média ponderada pela sua proximidade com o tempo atual. Como não existe uma, mas toda uma série de médias móveis para qualquer série, o conjunto de Mas pode ser plotado em gráficos, analisado como uma série e usado na modelagem e previsão. Uma gama de modelos pode ser construída usando médias móveis, e estes são conhecidos como modelos MA. Se tais modelos forem combinados com modelos autorregressivos (AR), os modelos compostos resultantes são conhecidos como modelos ARMA ou ARIMA (o I é para integrado). Médias móveis simples Uma vez que uma série temporal pode ser considerada como um conjunto de valores, t 1,2,3,4, n a média destes valores pode ser calculada. Se assumimos que n é bastante grande, e selecionamos um inteiro k que é muito menor que n. Podemos calcular um conjunto de médias de bloco, ou médias móveis simples (de ordem k): Cada medida representa a média dos valores de dados sobre um intervalo de k observações. Observe que a primeira MA possível de ordem k gt0 é aquela para t k. De forma mais geral, podemos descartar o subíndice extra nas expressões acima e escrever: Isto indica que a média estimada no tempo t é a média simples do valor observado no instante t e os intervalos de tempo anteriores k-1. Se forem aplicados pesos que diminuam a contribuição de observações que estão mais distantes no tempo, a média móvel é dita ser suavizada exponencialmente. As médias móveis são frequentemente utilizadas como uma forma de previsão, pelo que o valor estimado para uma série no tempo t 1, S t 1. É tomado como o MA para o período até e incluindo o tempo t. por exemplo. A estimativa de hoje é baseada em uma média de valores anteriores registrados até e inclusive ontem (para dados diários). As médias móveis simples podem ser vistas como uma forma de suavização. No exemplo ilustrado abaixo, o conjunto de dados sobre poluição atmosférica mostrado na introdução deste tópico foi aumentado por uma linha de média móvel de 7 dias, mostrada aqui em vermelho. Como pode ser visto, a linha de MA suaviza os picos e depressões nos dados e pode ser muito útil na identificação de tendências. A fórmula de cálculo de referência padrão significa que os primeiros pontos de dados k-1 não têm valor de MA, mas depois os cálculos se estendem até o ponto de dados final da série. Uma razão para calcular médias móveis simples da maneira descrita é que ela permite que os valores sejam calculados para todos os intervalos de tempo desde o tempo tk até o presente, e Como uma nova medição é obtida para o tempo t 1, o MA para o tempo t 1 pode ser adicionado ao conjunto já calculado. Isso fornece um procedimento simples para conjuntos de dados dinâmicos. No entanto, existem alguns problemas com esta abordagem. É razoável argumentar que o valor médio nos últimos 3 períodos, digamos, deve ser localizado no tempo t -1, não no tempo t. E para um MA sobre um número par de períodos, talvez ele deve ser localizado no ponto médio entre dois intervalos de tempo. Uma solução para esse problema é usar cálculos centralizados de MA, nos quais o MA no tempo t é a média de um conjunto simétrico de valores em torno de t. Apesar de seus méritos óbvios, esta abordagem não é geralmente usada porque exige que os dados estejam disponíveis para eventos futuros, o que pode não ser o caso. Em casos onde a análise é inteiramente de uma série existente, o uso de Mas centralizado pode ser preferível. As médias móveis simples podem ser consideradas como uma forma de suavização, removendo alguns componentes de alta freqüência de uma série de tempo e destacando (mas não removendo) as tendências de forma semelhante à noção geral de filtragem digital. De fato, as médias móveis são uma forma de filtro linear. É possível aplicar um cálculo da média móvel a uma série que já tenha sido suavizada, isto é, suavizar ou filtrar uma série já suavizada. Por exemplo, com uma média móvel de ordem 2, podemos considerá-la como sendo calculada usando pesos, então a MA em x 2 0,5 x 1 0,5 x 2. Da mesma forma, a MA em x 3 0,5 x 2 0,5 x 3. Se nós Aplicar um segundo nível de suavização ou filtragem, temos 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 ou seja, a filtragem de 2 estádios Processo (ou convolução) produziu uma média móvel simétrica ponderada variável, com pesos. Várias circunvoluções podem produzir médias móveis ponderadas bastante complexas, algumas das quais foram encontradas de uso particular em campos especializados, como nos cálculos de seguros de vida. As médias móveis podem ser usadas para remover efeitos periódicos se computadas com o comprimento da periodicidade como um conhecido. Por exemplo, com os dados mensais as variações sazonais podem frequentemente ser removidas (se este for o objetivo) aplicando uma média móvel simétrica de 12 meses com todos os meses ponderados igualmente, exceto o primeiro eo último que são ponderados por 12. Isto é porque haverá Ser de 13 meses no modelo simétrico (tempo atual, t. - 6 meses). O total é dividido por 12. Procedimentos semelhantes podem ser adotados para qualquer periodicidade bem definida. Médias móveis exponencialmente ponderadas (EWMA) Com a fórmula da média móvel simples: todas as observações são igualmente ponderadas. Se chamássemos esses pesos iguais, alfa t. Cada um dos k pesos seria igual a 1 k. Então a soma dos pesos seria 1, ea fórmula seria: Já vimos que múltiplas aplicações desse processo resultam em pesos variando. Com médias móveis ponderadas exponencialmente, a contribuição para o valor médio das observações que são mais removidas no tempo é deliberada reduzida, enfatizando os eventos mais recentes (locais). Essencialmente um parâmetro de suavização, 0lt alfa lt1, é introduzido, ea fórmula revisada para: Uma versão simétrica desta fórmula seria da forma: Se os pesos no modelo simétrico são selecionados como os termos dos termos da expansão binomial, (1212) 2q. Eles somarão a 1, e quando q se tornar grande, aproximar-se-á da distribuição Normal. Esta é uma forma de ponderação do kernel, com o Binomial agindo como a função do kernel. A convolução de dois estágios descrita na subseção anterior é precisamente esta disposição, com q 1, produzindo os pesos. Em suavização exponencial é necessário usar um conjunto de pesos que somam 1 e que reduzem em tamanho geometricamente. Os pesos usados ​​são tipicamente da forma: Para mostrar que esses pesos somam 1, considere a expansão de 1 como uma série. Podemos escrever e expandir a expressão entre parênteses usando a fórmula binomial (1-x) p. Onde x (1-) e p -1, o que dá: Isso então fornece uma forma de média móvel ponderada da forma: Esta soma pode ser escrita como uma relação de recorrência: o que simplifica muito a computação e evita o problema de que o regime de ponderação Deve ser estritamente infinito para os pesos a somar a 1 (para pequenos valores de alfa, isso normalmente não é o caso). A notação utilizada por diferentes autores varia. Alguns usam a letra S para indicar que a fórmula é essencialmente uma variável suavizada e escrevem: enquanto a literatura da teoria de controle usa freqüentemente Z em vez de S para os valores exponencialmente ponderados ou suavizados (ver, por exemplo, Lucas e Saccucci, 1990, LUC1 , Eo site do NIST para mais detalhes e exemplos trabalhados). As fórmulas citadas acima derivam do trabalho de Roberts (1959, ROB1), mas Hunter (1986, HUN1) usa uma expressão da forma: que pode ser mais apropriada para uso em alguns procedimentos de controle. Com alfa 1, a estimativa média é simplesmente o seu valor medido (ou o valor do item de dados anterior). Com 0,5 a estimativa é a média móvel simples das medições atuais e anteriores. Nos modelos de previsão, o valor, S t. É freqüentemente usado como estimativa ou valor de previsão para o próximo período de tempo, ou seja, como a estimativa para x no tempo t 1. Assim, temos: Isto mostra que o valor da previsão no tempo t 1 é uma combinação da média móvel exponencial ponderada anterior Mais um componente que representa o erro de previsão ponderado, epsilon. No tempo t. Supondo que uma série temporal é dada e uma previsão é necessária, um valor para alfa é necessário. Isto pode ser estimado a partir dos dados existentes, avaliando a soma dos erros de predição quadrados obtidos com valores variáveis ​​de alfa para cada t 2,3. Definindo a primeira estimativa como sendo o primeiro valor de dados observado, x 1. Em aplicações de controle, o valor de alfa é importante na medida em que é usado na determinação dos limites de controle superior e inferior e afeta o comprimento médio de execução (ARL) esperado Antes que esses limites de controle sejam quebrados (sob o pressuposto de que as séries temporais representam um conjunto de variáveis ​​independentes, aleatoriamente distribuídas, com variância comum). Nestas circunstâncias, a variância da estatística de controlo é (Lucas e Saccucci, 1990): Os limites de controlo são usualmente definidos como múltiplos fixos desta variância assintótica, e. - 3 vezes o desvio padrão. Se alfa 0,25, por exemplo, e os dados sendo monitorados forem assumidos como tendo uma distribuição Normal, N (0,1), quando em controle, os limites de controle serão - 1,134 e o processo atingirá um ou outro limite em 500 passos na média. Lucas e Saccucci (1990 LUC1) derivam os ARLs para uma ampla gama de valores alfa e sob várias suposições usando procedimentos de Cadeia de Markov. Eles tabulam os resultados, incluindo o fornecimento de ARLs quando a média do processo de controle foi deslocada por algum múltiplo do desvio padrão. Por exemplo, com um deslocamento 0,5 com alfa 0,25 o ARL é menos de 50 etapas de tempo. As abordagens descritas acima são conhecidas como suavização exponencial única. Uma vez que os procedimentos são aplicados uma vez à série temporal e, em seguida, análises ou processos de controlo são realizados no conjunto de dados suavizado resultante. Se o conjunto de dados incluir uma tendência e / ou componentes sazonais, a suavização exponencial de dois ou três estágios pode ser aplicada como um meio de remover (explicitamente modelar) esses efeitos (veja a seção sobre Previsão abaixo e o exemplo trabalhado pelo NIST). CHA1 Chatfield C (1975) A Análise da Série de Tempos: Teoria e Prática. Chapman e Hall, Londres HUN1 Hunter J S (1986) A média móvel exponencialmente ponderada. J of Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Esquemas de controlo da média móvel ponderada exponencialmente: propriedades e melhoramentos. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Testes de gráficos de controle baseados em médias móveis geométricas. Na segunda coluna desta tabela, é mostrada uma média móvel de ordem 5, fornecendo uma estimativa do ciclo tendencial. O primeiro valor nesta coluna é a média das cinco primeiras observações (1989-1993) o segundo valor na coluna 5-MA é a média dos valores 1990-1994 e assim por diante. Cada valor na coluna 5-MA é a média das observações no período de cinco anos centrado no ano correspondente. Não há valores para os dois primeiros anos ou últimos dois anos porque não temos duas observações de cada lado. Na fórmula acima, a coluna 5-MA contém os valores de hat com k2. Para ver como é a estimativa do ciclo tendencial, traçamos o gráfico juntamente com os dados originais da Figura 6.7. Parcela 40 elecsales, venda de eletricidade principal quotResidential, ylab quotGWhquot. 41 Observe como a tendência (em vermelho) é mais suave do que os dados originais e captura o movimento principal da série de tempo sem todas as flutuações secundárias. O método da média móvel não permite estimativas de T em que t está próximo das extremidades da série, portanto, a linha vermelha não se estende para os bordos do gráfico em qualquer lado. Posteriormente, usaremos métodos mais sofisticados de estimativa de ciclo tendencial que permitem estimativas próximas aos pontos finais. A ordem da média móvel determina a suavidade da estimativa de tendência-ciclo. Em geral, uma ordem maior significa uma curva mais suave. O gráfico a seguir mostra o efeito da alteração da ordem da média móvel para os dados de vendas de eletricidade residencial. As médias móveis simples como estas são normalmente de ordem ímpar (por exemplo, 3, 5, 7, etc.). Isto é assim que são simétricas: numa média móvel de ordem m2k1, existem k observações anteriores, k observações posteriores e a observação do meio Que são médias. Mas se m fosse uniforme, não seria mais simétrico. Médias móveis de médias móveis É possível aplicar uma média móvel a uma média móvel. Uma razão para fazer isso é fazer uma média móvel de ordem uniforme simétrica. Por exemplo, podemos pegar uma média móvel de ordem 4 e, em seguida, aplicar outra média móvel de ordem 2 aos resultados. Na Tabela 6.2, isso foi feito para os primeiros anos dos dados da produção de cerveja trimestral australiana. Beer2 lt - window 40 ausbeer, início 1992 41 ma4 ltm 40 beer2, ordem 4. center FALSE 41 ma2x4 ltm 40 cerveja2, ordem 4. center TRUE 41 A notação 2times4-MA na última coluna significa um 4-MA Seguido por um 2-MA. Os valores na última coluna são obtidos tomando uma média móvel de ordem 2 dos valores na coluna anterior. Por exemplo, os dois primeiros valores na coluna 4-MA são 451,2 (443410420532) 4 e 448,8 (410420532433) 4. O primeiro valor na coluna 2times4-MA é a média destes dois: 450,0 (451.2448.8) 2. Quando um 2-MA segue uma média móvel de ordem par (como 4), ele é chamado de média móvel centrada de ordem 4. Isso é porque os resultados são agora simétricos. Para ver que este é o caso, podemos escrever o 2times4-MA da seguinte forma: begin hat amp frac Bigfrac (y y y y) frac (y y y y) Big frac fray frac14y frac14y frac14y frac18y. Fim É agora uma média ponderada de observações, mas é simétrica. Outras combinações de médias móveis também são possíveis. Por exemplo, uma 3 x 3 MA é frequentemente utilizada e consiste numa média móvel de ordem 3 seguida por outra média móvel de ordem 3. Em geral, uma ordem par MA deve ser seguida por uma ordem par MA para torná-la simétrica. Similarmente, uma ordem ímpar MA deve ser seguida por uma ordem ímpar MA. Estimativa do ciclo tendencial com dados sazonais O uso mais comum de médias móveis centradas é estimar o ciclo tendencial a partir de dados sazonais. Considere o 2x4-MA: fracasso do chapéu frac14y frac14y frac14y frac18y. Quando aplicados aos dados trimestrais, cada trimestre do ano recebe igual peso, uma vez que o primeiro eo último termo se aplicam ao mesmo trimestre em anos consecutivos. Conseqüentemente, a variação sazonal será média e os valores resultantes de hat t terão pouca ou nenhuma variação sazonal restante. Um efeito semelhante seria obtido utilizando um 2-8 MA ou um 2-12 MA. Em geral, um m-MA 2x é equivalente a uma média móvel ponderada de ordem m1 com todas as observações tomando peso 1m exceto para o primeiro e último termos que tomam pesos 1 (2m). Portanto, se o período sazonal é par e de ordem m, use um m-MA 2x para estimar o ciclo tendencial. Se o período sazonal é ímpar e de ordem m, use um m-MA para estimar o ciclo de tendência. Em particular, um 2 x 12 MA pode ser usado para estimar o ciclo de tendência de dados mensais e um 7-MA pode ser usado para estimar a tendência-ciclo de dados diários. Outras escolhas para a ordem do MA normalmente resultarão em estimativas de ciclo de tendência sendo contaminadas pela sazonalidade nos dados. Exemplo 6.2 Fabricação de equipamentos elétricos A Figura 6.9 mostra um 2 x 12-MA aplicado ao índice de ordens de equipamentos elétricos. Observe que a linha suave não mostra sazonalidade é quase o mesmo que o ciclo de tendência mostrado na Figura 6.2 que foi estimado usando um método muito mais sofisticado do que as médias móveis. Qualquer outra escolha para a ordem da média móvel (exceto para 24, 36, etc.) teria resultado em uma linha suave que mostra algumas flutuações sazonais. Plot 40 elecequip, ylab quotNovas ordens indicequot. Col quotgrayquot, main quotredigtquot, 41 Quotred quotredquot 41 Médias móveis ponderadas As combinações de médias móveis resultam em médias móveis ponderadas. Por exemplo, o 2x4-MA discutido acima é equivalente a um 5-MA ponderado com pesos dados por frac, frac, frac, frac, frac. Em geral, uma m-MA ponderada pode ser escrita como hat t sum k aj y, onde k (m-1) 2 e os pesos são dados por a, dots, ak. É importante que todos os pesos somem a um e que sejam simétricos para que aj a. O m-MA simples é um caso especial onde todos os pesos são iguais a 1m. Uma grande vantagem das médias móveis ponderadas é que elas produzem uma estimativa mais suave do ciclo tendencial. Em vez das observações que entram e que deixam o cálculo no peso cheio, seus pesos são aumentados lentamente e então lentamente diminuídos resultando em uma curva mais lisa. Alguns conjuntos específicos de pesos são amplamente utilizados. Alguns destes são dados na Tabela 6. 3. Análise da Série Temporal: O Processo de Ajuste Sazonal Quais são as duas principais filosofias de ajuste sazonal O que é um filtro Qual é o problema do ponto final Como decidimos qual filtro usar O que é uma função de ganho O que é um deslocamento de fase O que são médias móveis Henderson Como lidamos com o problema do ponto final O que são médias móveis sazonais Por que as estimativas de tendência são revisadas Quanta informação é necessária para obter estimativas ajustadas sazonalmente aceitáveis ​​AVANÇADO Como as duas filosofias de ajuste sazonal comparam WHAT SÃO AS DOIS PRINCIPAIS FILOSOFIAS DE AJUSTE ESTACIONAL As duas principais filosofias para o ajuste sazonal são o método baseado em modelo e o método baseado em filtros. Métodos baseados em filtros Este método aplica um conjunto de filtros fixos (médias móveis) para decompor as séries temporais em uma componente tendencial, sazonal e irregular. A noção subjacente é que os dados econômicos são compostos por uma série de ciclos, incluindo ciclos econômicos (a tendência), ciclos sazonais (sazonalidade) e ruído (componente irregular). Um filtro essencialmente remove ou reduz a resistência de certos ciclos a partir dos dados de entrada. Para produzir uma série ajustada sazonalmente a partir dos dados coletados mensalmente, os eventos que ocorrem a cada 12, 6, 4, 3, 2,4 e 2 meses precisam ser removidos. Estes correspondem a frequências sazonais de 1, 2, 3, 4, 5 e 6 ciclos por ano. Os ciclos não sazonais mais longos são considerados parte da tendência e os ciclos não sazonais mais curtos formam o irregular. No entanto, o limite entre a tendência e ciclos irregulares pode variar com o comprimento do filtro utilizado para obter a tendência. No ABS ajuste sazonal, ciclos que contribuem significativamente para a tendência são tipicamente maiores do que cerca de 8 meses para séries mensais e 4 trimestres para séries trimestrais. A tendência, os componentes sazonais e irregulares não precisam de modelos individuais explícitos. O componente irregular é definido como o que permanece após a tendência e os componentes sazonais foram removidos por filtros. Irregulares não apresentam características de ruído branco. Métodos baseados em filtros são freqüentemente conhecidos como métodos de estilo X11. Estes incluem X11 (desenvolvido pela U. S. Census Bureau), X11ARIMA (desenvolvido pela Estatística Canadá), X12ARIMA (desenvolvido pelo U. S. Census Bureau), STL, SABL e SEASABS (o pacote utilizado pelo ABS). As diferenças computacionais entre vários métodos na família X11 são principalmente o resultado de diferentes técnicas usadas nas extremidades da série temporal. Por exemplo, alguns métodos usam filtros assimétricos nas extremidades, enquanto outros métodos extrapolam as séries temporais e aplicam filtros simétricos à série estendida. Métodos baseados em modelos Esta abordagem requer que a tendência, os componentes sazonais e irregulares das séries temporais sejam modeladas separadamente. Assume-se que a componente irregular é 8220 ruído branco 8221 - que é todos os comprimentos de ciclo são igualmente representados. Os irregulares têm média zero e uma variância constante. A componente sazonal tem o seu próprio elemento de ruído. Dois pacotes de software amplamente utilizados que aplicam métodos baseados em modelos são STAMP e SEATSTRAMO (desenvolvido pelo Banco de Espanha.) As principais diferenças computacionais entre os vários métodos baseados em modelos são geralmente devido a especificações do modelo, em alguns casos os componentes são modelados diretamente. Exigem que as séries temporais originais sejam modeladas primeiro e os modelos componentes sejam decompostos a partir dele Para uma comparação das duas filosofias a um nível mais avançado, veja Como as duas filosofias de ajuste sazonal se comparam O QUE É UM FILTRO Os filtros podem ser usados ​​para decompor Uma série de tempo em uma tendência, componente sazonal e irregular. Moedas médias são um tipo de filtro que sucessivamente média um período de tempo de mudança de dados, a fim de produzir uma estimativa suavizada de uma série temporal. Esta série suavizada pode ser considerada como tendo sido derivado Através da execução de uma série de entradas através de um processo que filtra certos ciclos. Portanto, uma média móvel é muitas vezes referida como um filtro. O processo básico envolve a definição de um conjunto de pesos de comprimento m 1 m 2 1 como: Nota: um conjunto simétrico de pesos tem m 1 m 2 e wjw - j Um valor filtrado no tempo t pode ser calculado por onde Y t descreve o valor Da série temporal no instante t. Por exemplo, considere a seguinte série: Usando um filtro simétrico simples de 3 termos (ou seja, m 1 m 2 1 e todos os pesos são 13), o primeiro termo da série suavizada é obtido aplicando os pesos aos três primeiros termos do original Série: O segundo valor suavizado é produzido aplicando os pesos ao segundo, terceiro e quarto termos da série original: O QUE É O PROBLEMA DO PONTO FINAL Reconsiderar a série: Esta série contém 8 termos. No entanto, a série suavizada obtida aplicando filtro simétrico aos dados originais contém apenas 6 termos: Isto é porque há dados insuficientes nas extremidades da série para aplicar um filtro simétrico. O primeiro termo da série suavizada é uma média ponderada de três termos, centrada no segundo termo da série original. Uma média ponderada centrada no primeiro termo da série original não pode ser obtida como dados antes que este ponto não esteja disponível. Da mesma forma, não é possível calcular uma média ponderada centrada no último termo da série, pois não há dados após este ponto. Por esta razão, os filtros simétricos não podem ser usados ​​em nenhuma das extremidades de uma série. Isso é conhecido como o problema do ponto final. Analistas de séries temporais podem usar filtros assimétricos para produzir estimativas suavizadas nessas regiões. Neste caso, o valor suavizado é calculado 8216 fora do centro 8217, sendo a média determinada usando mais dados de um lado do ponto do que o outro de acordo com o que está disponível. Alternativamente, as técnicas de modelagem podem ser usadas para extrapolar as séries temporais e, em seguida, aplicar filtros simétricos para a série estendida. COMO DECIDEMOS O FILTRO A UTILIZAR O analista de séries temporais escolhe um filtro apropriado com base nas suas propriedades, como os ciclos que o filtro remove quando aplicado. As propriedades de um filtro podem ser investigadas usando uma função de ganho. As funções de ganho são usadas para examinar o efeito de um filtro em uma determinada freqüência na amplitude de um ciclo para uma série de tempo particular. Para obter mais detalhes sobre a matemática associada às funções de ganho, você pode baixar as Notas do Curso da Série de Tempo, um guia introdutório para a análise de séries temporais publicada pela Seção de Análise de Séries Temporais do ABS (consulte a seção 4.4). O diagrama a seguir é a função de ganho para o filtro de 3 terminais simétricos que estudamos anteriormente. Figura 1: Função de ganho para o filtro simétrico de 3 períodos O eixo horizontal representa o comprimento de um ciclo de entrada em relação ao período entre os pontos de observação da série temporal original. Assim, um ciclo de entrada de comprimento 2 é completado em 2 períodos, o que representa 2 meses para uma série mensal e 2 trimestres para uma série trimestral. O eixo vertical mostra a amplitude do ciclo de saída em relação a um ciclo de entrada. Este filtro reduz a intensidade de 3 ciclos de período para zero. Ou seja, remove completamente ciclos de aproximadamente este comprimento. Isto significa que para uma série de tempo onde os dados são coletados mensalmente, quaisquer efeitos sazonais que ocorrem trimestralmente serão eliminados aplicando este filtro à série original. Um desvio de fase é o deslocamento de tempo entre o ciclo filtrado e o ciclo não filtrado. Um deslocamento de fase positivo significa que o ciclo filtrado é deslocado para trás e um desvio de fase negativo é deslocado para a frente no tempo. O deslocamento de fase ocorre quando a temporização dos pontos de viragem é distorcida, por exemplo quando a média móvel é colocada fora do centro pelos filtros assimétricos. Isso é que eles ocorrerão mais cedo ou mais tarde na série filtrada, do que no original. As médias móveis simétricas de comprimento ímpar (usadas pelo ABS), onde o resultado é colocado centralmente, não causam deslocamento de fase do tempo. É importante que os filtros usados ​​para derivar a tendência para manter a fase de tempo e, portanto, o tempo de quaisquer pontos de viragem. As Figuras 2 e 3 mostram os efeitos da aplicação de uma média móvel simétrica 2x12 que é descentrada. As curvas contínuas representam os ciclos iniciais e as curvas quebradas representam os ciclos de saída após a aplicação do filtro de média móvel. Figura 2: Ciclo de 24 meses, Fase -5,5 meses Amplitude 63 Figura 3: Ciclo de 8 meses, Fase -1,5 meses Amplitude 22 QUAIS SÃO MÉDIOS MOVENTES DE HENDERSON As médias móveis de Henderson são filtros que foram derivados por Robert Henderson em 1916 para uso em aplicações atuariais. Eles são filtros de tendência, comumente usados ​​em análise de séries temporais para suavizar estimativas ajustadas sazonalmente, a fim de gerar uma estimativa de tendência. Eles são usados ​​em preferência a médias móveis mais simples, porque eles podem reproduzir polinômios de até grau 3, capturando assim pontos de viragem de tendência. O ABS usa médias móveis Henderson para produzir estimativas de tendência de uma série ajustada sazonalmente. As estimativas de tendência publicadas pelo ABS são tipicamente derivadas usando um filtro de Henderson de 13 termos para séries mensais e um filtro de Henderson de 7 termos para séries trimestrais. Os filtros de Henderson podem ser simétricos ou assimétricos. As médias móveis simétricas podem ser aplicadas em pontos suficientemente afastados das extremidades de uma série temporal. Neste caso, o valor suavizado para um dado ponto na série temporal é calculado a partir de um número igual de valores em ambos os lados do ponto de dados. Para obter os pesos, é alcançado um compromisso entre as duas características geralmente esperadas de uma série de tendências. Estes são que a tendência deve ser capaz de representar uma ampla gama de curvaturas e que ele também deve ser tão suave quanto possível. Para a derivação matemática dos pesos, consulte a seção 5.3 das Notas do Curso da Série de Tempo. Que pode ser baixado gratuitamente no site da ABS. Os padrões de ponderação para uma faixa de médias móveis de Henderson simétricas são apresentados na tabela a seguir: Padrão de ponderação simétrica para Henderson Moving Average Em geral, quanto maior o filtro de tendência, mais suave a tendência resultante, como é evidente a partir de uma comparação das funções de ganho acima. Um Henderson de 5 termos reduz ciclos de aproximadamente 2,4 períodos ou menos em pelo menos 80, enquanto que um termo de 23 Henderson reduz ciclos de cerca de 8 períodos ou menos em pelo menos 90. De fato, um termo de 23 Henderson filtro remove completamente ciclos de menos de 4 períodos . Henderson médias móveis também moderar os ciclos sazonais em graus variados. No entanto, as funções de ganho nas Figuras 4-8 mostram que os ciclos anuais nas séries mensal e trimestral não são suficientemente amortecidos para justificar a aplicação de um filtro de Henderson diretamente às estimativas originais. É por isso que eles são aplicados apenas a uma série ajustada sazonalmente, onde os efeitos relacionados calendário já foram removidos com filtros projetados especificamente. A Figura 9 mostra os efeitos de alisamento da aplicação de um filtro de Henderson a uma série: Figura 9: Filtro de Henderson de 23 Dias - Valor de Aprovações de Edifícios Não Residenciais COMO NÓS LIDAMOS COM O PROBLEMA DE PONTO FINAL O filtro de Henderson simétrico só pode ser aplicado a regiões De dados que estão suficientemente longe dos extremos da série. Por exemplo, o termo padrão 13 Henderson só pode ser aplicado a dados mensais que é pelo menos 6 observações a partir do início ou final dos dados. Isso ocorre porque a suavidade do filtro da série, tendo uma média ponderada dos 6 termos de cada lado do ponto de dados, bem como o ponto em si. Se tentarmos aplicá-lo a um ponto que é inferior a 6 observações a partir do final dos dados, então não há dados suficientes disponíveis em um lado do ponto para calcular a média. Para fornecer estimativas de tendência destes pontos de dados, utiliza-se uma média móvel modificada ou assimétrica. O cálculo de filtros Henderson assimétricos pode ser gerado por uma série de métodos diferentes que produzem resultados semelhantes, mas não idênticos. Os quatro métodos principais são o método de Musgrave, o método de Minimização do Quadrado Médio, o método Best Linear Unbiased Estimates (AZUL) eo método de Kenny e Durbin. Shiskin et. Al (1967) derivaram os pesos assimétricos originais para a média móvel de Henderson que são usados ​​dentro dos pacotes X11. Para obter informações sobre a derivação dos pesos assimétricos, consulte a seção 5.3 das notas do curso da série temporal. Considere uma série de tempo onde o último ponto de dados observado ocorre no tempo N. Então um filtro de Henderson de 13 termos simétricos não pode ser aplicado a pontos de dados que são medidos a qualquer momento após e incluindo o tempo N-5. Para todos esses pontos, um conjunto de pesos assimétrico deve ser usado. A tabela a seguir apresenta o padrão de ponderação assimétrica para uma média móvel de Henderson de 13 termos. Os filtros de Henderson de 13 termos assimétricos não removem nem amortecem os mesmos ciclos que o filtro de Henderson de 13 termos simétrico. De fato, o padrão de ponderação assimétrica usado para estimar a tendência na última observação amplifica a força de 12 ciclos de período. Também filtros assimétricos produzem algum deslocamento de fase de tempo. QUAIS SÃO AS MÉDIA MOVIMENTO SAZONÁRIO Quase todos os dados investigados pelo ABS têm características sazonais. Como as médias móveis de Henderson usadas para estimar a série de tendências não eliminam a sazonalidade, os dados devem ser ajustados sazonalmente primeiro usando filtros sazonais. Um filtro sazonal tem pesos que são aplicados ao mesmo período ao longo do tempo. Um exemplo do padrão de ponderação para um filtro sazonal seria: (13, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 13, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 13) onde, por exemplo, um peso de um terço é aplicado a três janeiro consecutivos. Dentro de X11, uma série de filtros sazonais estão disponíveis para escolher. Estas são uma média móvel ponderada de três períodos (ma) S 3x1. Ponderado 5-term ma S 3x3. Ponderada 7-termo ma S 3x5. E uma ponderada 11-termo ma S 3x9. A estrutura de ponderação das médias móveis ponderadas da forma, S nxm. É que uma média simples de m termos calculados e, em seguida, uma média móvel de n dessas médias é determinada. Isto significa que os termos nm-1 são usados ​​para calcular cada valor suavizado final. Por exemplo, para calcular um 11-termo S 3x9. Um peso de 19 é aplicado ao mesmo período em 9 anos consecutivos. Em seguida, é aplicada uma média móvel de 3 termos simples através dos valores médios: Isto dá um padrão de ponderação final de (127, 227, 19, 19, 19, 19, 19, 19, 19, 227, 127). A função de ganho para um filtro sazonal de 11 períodos, S 3x9. Se como: Figura 10: Função de ganho para 11 Term (S 3x9) Filtro sazonal Aplicando um filtro sazonal aos dados irá gerar uma estimativa da componente sazonal da série temporal, uma vez que preserva a força dos harmônicos sazonais e amortece os ciclos de não - Sazonais. Filtros sazonais assimétricos são usados ​​nas extremidades da série. Os pesos assimétricos para cada um dos filtros sazonais usados ​​em X11 podem ser encontrados na seção 5.4 das Notas do Curso da Série de Tempo. Por que as estimativas de tendências são revisadas No final atual de uma série de tempo, não é possível usar filtros simétricos para estimar a tendência por causa do problema do ponto final. Em vez disso, filtros assimétricos são usados ​​para produzir estimativas de tendência provisórias. No entanto, à medida que mais dados se tornam disponíveis, é possível recalcular a tendência usando filtros simétricos e melhorar as estimativas iniciais. Isso é conhecido como uma revisão de tendência. QUANTIDADE DE DADOS É OBRIGADA A OBTER ESTIMATIVAS ACEITÁVEIS AJUSTADAS SAZONALMENTE Se uma série temporal exibir sazonalidade relativamente estável e não for dominada pela componente irregular, então 5 anos de dados podem ser considerados um comprimento aceitável para derivar estimativas ajustadas sazonalmente de. Para uma série que mostra uma sazonalidade particularmente forte e estável, um ajuste bruto pode ser feito com 3 anos de dados. É geralmente preferível ter pelo menos 7 anos de dados para uma série de tempo normal, para identificar precisamente padrões sazonais, dia de negociação e efeitos de férias em movimento, tendência e quebras sazonais, bem como outliers. As abordagens baseadas em modelos permitem as propriedades estocásticas (aleatoriedade) da série em análise, no sentido de que elas adaptam os pesos dos filtros com base na natureza da série. A capacidade do modelo 8217s para descrever com precisão o comportamento da série pode ser avaliada, e inferências estatísticas para as estimativas estão disponíveis com base no pressuposto de que o componente irregular é o ruído branco. Os métodos baseados em filtros são menos dependentes das propriedades estocásticas das séries temporais. É responsabilidade do analista de séries temporais escolher o filtro mais apropriado de uma coleção limitada para uma série particular. Não é possível realizar verificações rigorosas sobre a adequação do modelo implícito e medidas exatas de precisão e inferência estatística não estão disponíveis. Portanto, um intervalo de confiança não pode ser construído em torno da estimativa. Os diagramas a seguir comparam a presença de cada um dos componentes do modelo nas freqüências sazonais para as duas filosofias de ajuste sazonal. O eixo x é o comprimento do período do ciclo eo eixo y representa a força dos ciclos que compreendem cada componente: Figura 11: Comparação das duas filosofias de ajuste sazonal Os métodos baseados em filtros pressupõem que cada componente existe apenas um certo comprimento de ciclo. Os ciclos mais longos formam a tendência, a componente sazonal está presente nas frequências sazonais ea componente irregular é definida como ciclos de qualquer outro comprimento. Sob uma filosofia baseada em modelo, a tendência, componente sazonal e irregular estão presentes em todos os comprimentos de ciclo. O componente irregular é de força constante, os picos de componente sazonal em frequências sazonais ea componente de tendência é mais forte nos ciclos mais longos. Esta página foi publicada pela primeira vez em 14 de Novembro de 2005, actualizada pela última vez em 25 de Julho de 2008

No comments:

Post a Comment