Monday 24 July 2017

Componente De Movimento Médio Sazonal


Implementação da planilha de ajuste sazonal e suavização exponencial É direto realizar ajustes de sazonal e ajustar modelos de suavização exponencial usando o Excel. As imagens de tela e os gráficos abaixo são retirados de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e o alisamento exponencial linear nos seguintes dados trimestrais de vendas da Outboard Marine: Para obter uma cópia do próprio arquivo de planilha, clique aqui. A versão do alisamento exponencial linear que será usada aqui para fins de demonstração é a versão Brown8217s, meramente porque pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar. Normalmente, é melhor usar a versão Holt8217s que possui constantes de suavização separadas para nível e tendência. O processo de previsão prossegue da seguinte forma: (i) primeiro os dados são ajustados sazonalmente (ii), então, as previsões são geradas para os dados sazonalmente ajustados através de alisamento exponencial linear e (iii) finalmente, as previsões sazonalmente ajustadas são quantitativas para obter previsões para a série original . O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é calcular uma média móvel centrada (realizada aqui na coluna D). Isso pode ser feito tomando a média de duas médias de um ano que são compensadas por um período relativo um ao outro. (Uma combinação de duas médias de compensação em vez de uma única média é necessária para fins de centralização quando o número de estações é igual.) O próximo passo é calcular a proporção para a média móvel - i. e. Os dados originais divididos pela média móvel em cada período - o que é realizado aqui na coluna E. (Isso também é chamado de quottrend-cyclequot componente do padrão, na medida em que os efeitos da tendência e do ciclo comercial podem ser considerados como sendo tudo isso Permanece após uma média de um ano inteiro de dados. Claro, as mudanças de mês a mês que não são devidas à sazonalidade podem ser determinadas por muitos outros fatores, mas a média de 12 meses suaviza sobre eles em grande medida. O índice sazonal estimado para cada estação é calculado pela primeira média de todos os índices para essa estação específica, o que é feito nas células G3-G6 usando uma fórmula AVERAGEIF. Os rácios médios são então redimensionados de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400 neste caso, o que é feito nas células H3-H6. Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em cada linha da tabela de dados, de acordo com o quarto do ano que representa. A média móvel centrada e os dados sazonalmente ajustados ficam assim: note que a média móvel normalmente se parece com uma versão mais suave da série ajustada sazonalmente, e é mais curta em ambas as extremidades. Outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo linear de suavização exponencial aos dados dessazonalizados, começando na coluna G. Um valor para a constante de alisamento (alfa) é inserido acima da coluna de previsão (aqui, na célula H9) e Por conveniência, é atribuído o nome do intervalo quotAlpha. quot (O nome é atribuído usando o comando quotInsert Name Createquot.) O modelo LES é inicializado definindo as duas primeiras previsões iguais ao primeiro valor real da série sazonalmente ajustada. A fórmula usada aqui para a previsão LES é a forma recursiva de equação única do modelo Brown8217s: Esta fórmula é inserida na célula correspondente ao terceiro período (aqui, célula H15) e copiada a partir daí. Observe que a previsão LES para o período atual refere-se às duas observações precedentes e aos dois erros de previsão precedentes, bem como ao valor de alfa. Assim, a fórmula de previsão na linha 15 refere-se apenas a dados que estavam disponíveis na linha 14 e anteriores. (É claro que, se desejássemos usar um alisamento exponencial linear em vez de linear, poderíamos substituir a fórmula SES aqui em vez disso. Também poderíamos usar Holt8217s em vez do modelo LES Brown8217s, o que exigiria mais duas colunas de fórmulas para calcular o nível e a tendência Que são usados ​​na previsão). Os erros são computados na próxima coluna (aqui, coluna J) subtraindo as previsões dos valores reais. O erro quadrático médio é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. (Isso se segue à identidade matemática: VARIÂNCIA MSE (erros) (MÉDIA (erros)) 2. No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo na verdade não inicia a previsão até O terceiro período (linha 15 na planilha). O valor ideal de alfa pode ser encontrado alterando o alfa manualmente até que o RMSE mínimo seja encontrado, ou então você pode usar o quotSolverquot para executar uma minimização exata. O valor de alfa que o Solver encontrou é mostrado aqui (alfa0.471). Geralmente é uma boa idéia traçar os erros do modelo (em unidades transformadas) e também calcular e traçar suas autocorrelações em atrasos de até uma estação. Aqui está uma série de séries temporais dos erros (ajustados sazonalmente): as autocorrelações de erro são computadas usando a função CORREL () para calcular as correlações dos erros com elas mesmas atrasadas por um ou mais períodos - os detalhes são mostrados no modelo de planilha . Aqui está um enredo das autocorrelações dos erros nos primeiros cinco atrasos: as autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas o pico no intervalo 4 (cujo valor é 0.35) é um pouco incômodo - sugere que o O processo de ajuste sazonal não foi completamente bem sucedido. No entanto, na verdade, é apenas marginalmente significativo. 95 bandas de significância para testar se as autocorrelações são significativamente diferentes de zero são mais ou menos 2 SQRT (n-k), onde n é o tamanho da amostra e k é o atraso. Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada de n-menos-k é em torno de 6 para todos eles e, portanto, os limites para testar a significância estatística de desvios de zero são aproximadamente mais - Ou menos 2 6, ou 0,33. Se você variar o valor do alfa à mão neste modelo do Excel, você pode observar o efeito na série de tempo e nos gráficos de autocorrelação dos erros, bem como no erro da raiz-médio-quadrado, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é citada no futuro, simplesmente substituindo as previsões por valores reais no ponto em que os dados reais se esgotaram - ou seja. Onde quotthe futurequot começa. (Em outras palavras, em cada célula onde um futuro valor de dados ocorreria, uma referência de célula é inserida que aponta para a previsão feita para esse período.) Todas as outras fórmulas são simplesmente copiadas de cima para cima: Observe que os erros para as previsões de O futuro é calculado para ser zero. Isso não significa que os erros reais serão zero, mas sim reflete apenas o fato de que, para fins de predição, estamos assumindo que os dados futuros serão iguais às previsões em média. As previsões resultantes de LES para os dados dessazonalizados são assim: com este valor particular de alfa, otimizado para previsões de um período de antecedência, a tendência projetada é ligeiramente ascendente, refletindo a tendência local observada nos últimos 2 anos ou então. Para outros valores de alfa, uma projeção de tendência muito diferente pode ser obtida. Geralmente, é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando o alfa é variado, porque o valor que é melhor para a previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado que é obtido se o valor de alfa for ajustado manualmente para 0.25: A tendência de longo prazo projetada agora é negativa em vez de positiva. Com um menor valor de alfa, o modelo está colocando mais peso em dados mais antigos em A estimativa do nível e da tendência atual e suas previsões de longo prazo refletem a tendência de queda observada nos últimos 5 anos em vez da tendência ascendente mais recente. Este gráfico também ilustra claramente como o modelo com um menor valor de alfa é mais lento para responder aos pontos de referência nos dados e, portanto, tende a fazer um erro do mesmo sinal por vários períodos seguidos. Seus erros de previsão de 1 passo a frente são maiores em média do que os obtidos antes (RMSE de 34,4 em vez de 27,4) e fortemente auto-correlacionados positivamente. A autocorrelação de lag-1 de 0,56 excede muito o valor de 0,33 calculado acima para um desvio estatisticamente significativo de zero. Como alternativa para diminuir o valor do alfa, a fim de introduzir mais conservadorismo em previsões de longo prazo, um fator de amortecimento de quotstend às vezes é adicionado ao modelo, a fim de tornar a tendência projetada abrandar depois de alguns períodos. O passo final na construção do modelo de previsão é para quantificar as previsões do LES, multiplicando-os pelos índices sazonais apropriados. Assim, as previsões reestruturadas na coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões de LES temporariamente ajustadas na coluna H. É relativamente fácil calcular intervalos de confiança para previsões de um passo a frente feitas por este modelo: primeiro Computa o RMSE (erro da raiz-meio-quadrado, que é apenas a raiz quadrada do MSE) e depois calcula um intervalo de confiança para a previsão ajustada sazonalmente, adicionando e subtraindo duas vezes o RMSE. (Em geral, um intervalo de confiança 95 para uma previsão de um período anterior é aproximadamente igual ao ponto de previsão mais-ou-menos-duas vezes o desvio padrão estimado dos erros de previsão, assumindo que a distribuição do erro é aproximadamente normal e o tamanho da amostra É grande o suficiente, digamos, 20 ou mais. Aqui, o RMSE, em vez do desvio padrão da amostra dos erros, é a melhor estimativa do desvio padrão dos futuros erros de previsão porque leva também o viés, bem como variações aleatórias.) Os limites de confiança Para a previsão ajustada sazonalmente são então resgatados. Juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Nesse caso, o RMSE é igual a 27,4 e a previsão ajustada sazonalmente para o primeiro período futuro (dezembro-93) é 273,2. Então o intervalo de confiança 95 ajustado sazonalmente é de 273,2-227,4 218,4 a 273,2227,4 328,0. Multiplicando esses limites pelo índice sazonal Decembers de 68,61. Obtemos limites de confiança inferiores e superiores de 149,8 e 225,0 em torno da previsão do ponto 93 de 187,4. Os limites de confiança para as previsões mais de um período adiante geralmente se ampliarão à medida que o horizonte de previsão aumentar, devido à incerteza sobre o nível e a tendência, bem como os fatores sazonais, mas é difícil computá-los em geral por métodos analíticos. (A maneira apropriada de calcular os limites de confiança para a previsão LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão.) Se você quer um intervalo de confiança realista para uma previsão de mais de um período adiante, tomando todas as fontes de Erro na sua conta, a sua melhor opção é usar métodos empíricos: por exemplo, para obter um intervalo de confiança para uma previsão anterior de 2 passos, você poderia criar outra coluna na planilha para calcular uma previsão de duas etapas para cada período ( Por bootstrapping a previsão one-step-ahead). Em seguida, calcule o RMSE dos erros de previsão de 2 passos e use isso como base para um intervalo de confiança de 2 passos. Preparado com componente cíclico (Twentieth em uma série). Bem-vindo à nossa publicação 20 de sexta-feira de previsão. Nos últimos quatro meses, foi uma boa viagem, à medida que passamos por vários métodos de séries temporais, como modelos de média móvel, modelos de suavização exponencial e análise de regressão, seguidos de discussões aprofundadas sobre os pressupostos por trás da análise de regressão e as conseqüências e remédios de Violando esses pressupostos. Hoje, retomamos os aspectos mais práticos da análise das séries temporais, com uma discussão sobre a decomposição de uma série temporal. Se você lembrar da nossa publicação de 3 de maio. Uma série de tempo consiste em quatro componentes: um componente de tendência, um componente sazonal, um componente cíclico e um componente irregular, ou aleatório. Hoje, vamos mostrar-lhe como isolar e controlar esses componentes, usando o exemplo fictício de Billie Burton, um fabricante de cesta de presente independente. Billie Burton sempre gostou de fazer cestas de presente e pacotes de cuidados, e geriu seu próprio negócio nos últimos 10 anos. Billie sabe que o negócio parece estar aumentando ano após ano, mas ela também sabe que seu negócio é sazonal. Billie também está certo de que as pessoas não podem comprar tantos pacotes de cuidados e cestas de presente quando a economia estiver lenta. Ela está tentando avaliar o impacto de cada um desses componentes em seus negócios. Uma vez que o negócio de Billie8217 é uma loja de uma pessoa e todas as cestas de presente são feitas à mão (ela não faz as cestas ou seus conteúdos, mas as monta, as envolve decorativamente e os envia), ela está mais preocupada agora com a previsão do número de Ordens de cesta de presente, em vez de vendas, para que ela pudesse estimar sua carga de trabalho. Então, Billie reúne suas ordens mensais para os anos 2005-2009. Eles se parecem com isto: ORDENS TOTAL DE CESTA DE PRESENTES Quando uma variável exibe um aumento ou diminuição a longo prazo ao longo do tempo, é dito que tem uma tendência. As ordens de cesta de presente de Billie8217s nos últimos cinco anos exibem uma tendência de longo prazo, como mostra o gráfico de séries temporais abaixo: Embora o gráfico esteja bastante ocupado e esburacado, você pode ver que as ordens mensais de Billie8217s parecem estar se movendo para cima Tempo. Observe que encaixamos uma linha direta em toda a série de tempo de Billie8217s. Esta é uma linha de tendência linear. Na maioria das vezes, traçamos os dados em uma série de tempo e, em seguida, desenhamos uma linha direta com a mão livre para mostrar se uma tendência está aumentando ou diminuindo. Outra abordagem para ajustar uma linha de tendência como a que usei aqui é usar análise de regressão simples, usando cada período de tempo, t, como a variável independente, e numerando cada período em ordem seqüencial. Assim, janeiro de 2005 seria t1 e dezembro de 2009 seria t60. Isso é muito parecido com a abordagem que discutimos em nossa postagem no blog de 27 de maio quando demonstramos como nossa outra mulher de negócios fictícia, Sue Stone, poderia prever suas vendas. Ao usar a análise de regressão, para ajustar nossa linha de tendência, obteríamos a seguinte equação: Como a inclinação da linha de tendência é positiva, sabemos que a tendência é ascendente. As ordens de Billie8217s parecem aumentar um pouco mais de metade de uma ordem por mês, em média. No entanto, quando olhamos para o R 2., obtemos apenas .313, sugerindo que a linha de tendência não corresponde aos dados reais. Mas isso é devido à drástica sazonalidade no conjunto de dados, que abordaremos em breve. Por enquanto, pelo menos sabemos que a tendência está aumentando. Quando uma série de tempo mostra um padrão de repetição ao longo do tempo, geralmente durante a mesma época do ano, esse padrão é conhecido como o componente sazonal na série temporal. Algumas séries temporais têm mais de um período no ano em que a sazonalidade é forte, outros não têm sazonalidade. Se você olhar para cada um dos pontos de janeiro, você notará que é muito menor do que em dezembro anterior e no mês de fevereiro seguinte. Além disso, se você olhar para cada dezembro, você verá que é o ponto mais alto de pedidos para cada ano. Isso sugere fortemente a sazonalidade nos dados. Mas qual é o impacto da sazonalidade, descobrimos isolando o componente sazonal e criando um índice sazonal, conhecido como a proporção da média móvel. A computação da proporção para a média móvel é um processo em quatro etapas: primeiro, tome a média móvel da série. Uma vez que nossos dados são mensais, tomaremos uma média móvel de 12 meses. Se nossos dados fossem trimestrais, faríamos uma média móvel de 4 quartos. We8217ve essencialmente feito isso na terceira coluna da tabela abaixo. Em seguida, concentramos as médias móveis tomando a média de cada par sucessivo de médias móveis, o resultado é mostrado na quarta coluna. Em terceiro lugar, calcular a proporção para a média móvel Para obter a proporção para a média móvel, divida o número de pedidos de um mês determinado pela média móvel centrada de 12 meses que corresponde a esse mês. Observe que julho de 2005 é o primeiro mês para ter uma média móvel centrada em 12 meses. Isso é porque perdemos pontos de dados quando tomamos uma média móvel. Para julho de 2005, dividimos seu número de pedidos, 12, por sua média móvel de 12 meses centralizada, 21,38, e obtenha .561 (o número 8217 multiplicado por 100 por porcentagens, neste exemplo). Temos exatamente 48 meses de índices para examinar. Permite plotar cada ano8217s em um gráfico: À primeira vista, parece que há apenas duas linhas nos gráficos, as dos anos três e quatro. No entanto, todos os quatro anos estão representados neste gráfico. It8217s apenas que todos os pontos de inflexão são os mesmos, e a proporção para as médias móveis para cada mês são quase idênticas. A única diferença é no ano 3 (julho de 2007 a junho de 2008). Observe como a linha verde para o terceiro ano não segue o mesmo padrão que os outros anos, de fevereiro a abril. O índice do ano 38217 para a média móvel é realmente maior em março do que em todos os anos anteriores e menor para abril. Isso ocorre porque o domingo de Páscoa caiu no final de março de 2008, então a temporada de cesta de presente da Páscoa foi movida algumas semanas antes do que em anos anteriores. Finalmente, calcula o índice sazonal médio por cada mês. Agora, temos a proporção de médias móveis para cada mês. Let8217s os média: RATIO PARA MOVIMENTAR MÉDIA Assim, vemos que agosto é um mês normal (o índice sazonal médio 1). No entanto, olhe para dezembro. Seu índice sazonal é 1,75. Isso significa que as ordens de Billie8217s geralmente são 175 por cento maiores do que a média mensal em dezembro. Dada a temporada de doação de presente de Natal, que aposta no ano passado no negócio da cesta de presente de Billie8217s. Também observamos índices sazonais mais altos em novembro (quando a temporada de compras de Natal começa), fevereiro (Dia dos Namorados8217s) e em abril (Páscoa). Os outros meses tendem a estar abaixo da média. Observe que o mês de abril não está bem acima da linha de base e que março teve um ano em que o índice de 8217s foi de 1,25 (quando em outros anos estava abaixo de 0,80). Isso porque a Páscoa às vezes cai no final de março. Coisas como esta é importante para acompanhar, uma vez que pode afetar dramaticamente o planejamento. Além disso, se um determinado mês tiver cinco fins de semana por ano e apenas 4 fins de semana, o próximo ou se o ano bissexto adiciona um dia em fevereiro a cada quatro anos, dependendo do seu negócio, esses eventos podem fazer uma grande diferença na precisão de suas previsões. Os Componentes Cíclicos e Irregulares Agora que isolamos a tendência e os componentes sazonais, sabemos que os pedidos de Billie8217s apresentam uma tendência crescente e que as ordens tendem a estar acima da média em novembro, dezembro, fevereiro e abril. Agora precisamos isolar os componentes cíclicos e sazonais. As variações cíclicas não se repetem em um padrão regular, mas também não são variações aleatórias. Os padrões cíclicos são reconhecíveis, mas quase sempre variam em intensidade (a altura de pico a calha) e a temporização (freqüência com a qual ocorrem os picos e depressões). Como eles não podem ser preditos com precisão, eles são geralmente analisados ​​com os componentes irregulares. A forma como isolamos os componentes cíclicos e irregulares é isolar primeiro a tendência e os componentes sazonais, como fizemos acima. Então, nós tomamos nossa equação de regressão de tendência de cima, conecte cada número de seqüência de cada mês8217 para obter o valor de tendência. Então, multiplicamo-lo por essa proporção sazonal média do mês8217s à média móvel para derivar o padrão estatístico. Para derivar o componente irregular cíclico, dividimos as ordens reais desse mês pelo padrão estatístico. A tabela a seguir mostra-nos como: Taxa de Índice Sazonal Componente Irregular Cíclico 8211 () Na maioria das vezes, as ordens de Billie8217s, don8217t, parecem exibir muito comportamento cíclico ou irregular. Na maioria dos meses, a proporção de componentes cíclicos e irregulares é bastante próxima de 100. Dado seu tipo de negócio, sabemos que isso seria ou não verdadeiro ou casual, uma vez que a recessão de 2008 a 2009 provavelmente significaria uma redução nos pedidos. Em muitos desses meses, esperamos ver uma proporção bem abaixo de 100. Verificamos que, em grande parte de 2005, o componente cíclico-irregular para as ordens de cesta de presente de Billie8217s está bem acima de 100. É muito provável que, nesses anos, O negócio de Billie8217 estava vendo um padrão cíclico positivo. Verificamos padrões irregulares em março e abril de anos posteriores, onde o componente cíclico-irregular também está bem acima de 100. Esse tipo de irregularidade novamente é a irregularidade de quando a Páscoa cai. Não surpreendentemente, a Páscoa tem um componente sazonal e irregular. Isso não significa que Billie possa levantar os pés e ter certeza de que seu negócio não sofre muito com padrões cíclicos ou irregulares. Um aprofundamento da recessão pode, em última instância, afundar suas ordens, uma guerra pode cortar os materiais que são usados ​​para produzir suas cestas de presente, um aumento de preços escasso ou drástico nos materiais que ela usa, também pode forçar seus preços mais altos, o que, por sua vez, reduz suas ordens A oficina poderia ser destruída em uma inundação ou incêndio e assim por diante. Para lidar com alguns desses padrões irregulares que são quase impossíveis de planejar, Billie compraria um seguro. Conhecer a composição de uma série temporal é um elemento importante da previsão. Descompactar a série temporal ajuda os tomadores de decisão a conhecer e explicar a variabilidade em seus dados e a quantidade de ele para atribuí-lo aos componentes de tendência, sazonal, cíclica e irregular. Na semana seguinte, a previsão de sexta-feira de sexta-feira, discutiremos como prever usando dados que são ajustados sazonalmente. Deixe novas postagens vir para você Categorias

No comments:

Post a Comment