Moving Average Forecasting Introdução. Como você pode imaginar, estamos olhando para algumas das abordagens mais primitivas para a previsão. Mas espero que estas sejam pelo menos uma introdução interessante a algumas das questões de computação relacionadas à implementação de previsões em planilhas. Neste sentido, vamos continuar a partir do início e começar a trabalhar com previsões de média móvel. Previsões médias móveis. Todo mundo está familiarizado com as previsões de média móvel, independentemente de eles acreditam que são. Todos os estudantes universitários fazê-los o tempo todo. Pense nas suas pontuações dos testes num curso em que vai ter quatro testes durante o semestre. Vamos supor que você tem um 85 em seu primeiro teste. O que você poderia prever para sua pontuação do segundo teste O que você acha que seu professor iria prever para a sua próxima pontuação de teste O que você acha que seus amigos podem prever para a sua próxima pontuação de teste O que você acha que seus pais podem prever para sua pontuação próxima teste Independentemente de Todo o blabbing você pôde fazer a seus amigos e pais, eles e seu professor são muito prováveis esperar que você comece algo na área do 85 que você começou apenas. Bem, agora vamos supor que, apesar de sua auto-promoção para seus amigos, você superestimar-se e figura que você pode estudar menos para o segundo teste e assim você começa um 73. Agora o que são todos os interessados e despreocupado vai Antecipar você vai chegar em seu terceiro teste Existem duas abordagens muito provável para que eles desenvolvam uma estimativa, independentemente de se eles vão compartilhar com você. Eles podem dizer a si mesmos: "Esse cara está sempre soprando fumaça sobre suas espertinas. Hes que vai obter outro 73 se hes afortunado. Talvez os pais tentem ser mais solidários e dizer: "Bem, até agora você tem obtido um 85 e um 73, então talvez você deve figura em obter cerca de um (85 73) / 2 79. Eu não sei, talvez se você fez menos Festejando e werent abanando a doninhas em todo o lugar e se você começou a fazer muito mais estudando você poderia obter uma pontuação mais alta. quot Ambas as estimativas são, na verdade, média móvel previsões. O primeiro é usar apenas sua pontuação mais recente para prever o seu desempenho futuro. Isso é chamado de média móvel usando um período de dados. A segunda também é uma média móvel, mas usando dois períodos de dados. Vamos supor que todas essas pessoas rebentando em sua grande mente têm tipo de puto você fora e você decidir fazer bem no terceiro teste para suas próprias razões e colocar uma pontuação mais alta na frente de seus quotalliesquot. Você toma o teste e sua pontuação é realmente um 89 Todos, incluindo você mesmo, está impressionado. Então agora você tem o teste final do semestre chegando e, como de costume, você sente a necessidade de incitar todo mundo a fazer suas predições sobre como você vai fazer no último teste. Bem, espero que você veja o padrão. Agora, espero que você possa ver o padrão. Qual você acha que é o apito mais preciso enquanto trabalhamos. Agora vamos voltar para a nossa nova empresa de limpeza iniciada por sua meia irmã distante chamado Whistle While We Work. Você tem alguns dados de vendas anteriores representados na seção a seguir de uma planilha. Primeiro, apresentamos os dados para uma previsão média móvel de três períodos. A entrada para a célula C6 deve ser Agora você pode copiar esta fórmula de célula para baixo para as outras células C7 a C11. Observe como a média se move sobre os dados históricos mais recentes, mas usa exatamente os três períodos mais recentes disponíveis para cada previsão. Você também deve notar que nós realmente não precisamos fazer as previsões para os períodos passados, a fim de desenvolver a nossa previsão mais recente. Isto é definitivamente diferente do modelo de suavização exponencial. Ive incluído o quotpast previsõesquot porque vamos usá-los na próxima página da web para medir a validade de previsão. Agora eu quero apresentar os resultados análogos para uma previsão média móvel de dois períodos. A entrada para a célula C5 deve ser Agora você pode copiar esta fórmula de célula para baixo para as outras células C6 a C11. Observe como agora apenas as duas mais recentes peças de dados históricos são utilizados para cada previsão. Mais uma vez incluí as previsões quotpast para fins ilustrativos e para uso posterior na validação de previsão. Algumas outras coisas que são de importância notar. Para uma previsão média móvel de m-período, apenas os m valores de dados mais recentes são usados para fazer a previsão. Nada mais é necessário. Para uma previsão média móvel de m-período, ao fazer previsões quotpastquot, observe que a primeira predição ocorre no período m 1. Ambas as questões serão muito significativas quando desenvolvemos nosso código. Desenvolvendo a função de média móvel. Agora precisamos desenvolver o código para a previsão da média móvel que pode ser usado de forma mais flexível. O código segue. Observe que as entradas são para o número de períodos que você deseja usar na previsão ea matriz de valores históricos. Você pode armazená-lo em qualquer pasta de trabalho que você deseja. Função MovingAverage (Histórico, NumberOfPeriods) Como Único Declarar e inicializar variáveis Dim Item Como variante Dim Counter Como Inteiro Dim Acumulação como único Dim HistoricalSize As Inteiro Inicializando variáveis Counter 1 Acumulação 0 Determinando o tamanho da Historical array HistoricalSize Historical. Count For Counter 1 To NumberOfPeriods Acumulando o número apropriado dos valores mais recentes anteriormente observados Acumulação Acumulação Histórico (HistoricalSize - NumberOfPeriods Counter) MovingAverage Acumulação / NumberOfPeriods O código será explicado na classe. Você quer posicionar a função na planilha para que o resultado da computação apareça onde ele deve gostar do seguinte. R - Previsão Vamos discutir como esses métodos funcionam e como usá-los. Vista geral do pacote de previsões edit Exponential Smoothing editar Nomes AKA: média móvel ponderada exponencialmente (EWMA) Equivalente a ARIMA (0,1,1) modelo sem termo constante Usado para dados suavizados para apresentação fazem previsões simples de média móvel: as observações passadas também estão ponderadas exponencialmente Suavização: atribui pesos exponencialmente decrescentes ao longo do tempo Fórmula xt - sequência de dados brutos st - saída do algoritmo de suavização exponencial (estimativa do próximo valor de x) - fator de suavização. 0160lt160160lt1601.Choosing direito nenhuma maneira formal de escolher a técnica estatística pode ser usado para otimizar o valor de (por exemplo, OLS) quanto maior for o próximo obtém a previsão ingênua (as mesmas portas que a série original com um período lag) Double Exponential Smoothing A suavização exponencial não funciona bem quando há uma tendência (haverá sempre um viés) O duplo alinhamento exponencial é um grupo de métodos que lidam com o problema Holt-Winters duplicação exponencial dupla edit E para t gt 1 por onde é o fator de suavização de dados. 0160lt160160lt1601, e é o fator de suavização de tendência. 0160lt160160lt1601. Saída F tm - uma estimativa do valor de x no tempo tm, mgt0 com base nos dados brutos até o tempo t A edição de suavização exponencial tripla leva em conta as mudanças sazonais, bem como as tendências sugeridas pela primeira vez por Holts estudante, Xt - sequência de dados brutos das observações t 1601600 L comprimento um ciclo de mudança sazonal O método calcula: uma linha de tendência para os índices sazonais de dados que pesam os valores na linha de tendência com base no ponto em que esse ponto de tempo cai no ciclo de comprimento L. S t representa o valor suavizado da parte constante para o tempo t. Bt representa a seqüência das melhores estimativas da tendência linear que se sobrepõem às mudanças sazonais ct é a seqüência dos fatores de correção sazonal ct é a proporção esperada da tendência prevista a qualquer momento t mod L no ciclo que as observações assumem To Inicializar os índices sazonais c tL deve haver pelo menos um ciclo completo nos dados A saída do algoritmo é novamente escrita como F tm. Uma estimativa do valor de x no tempo tm, mgt0 com base nos dados brutos até o tempo t. A suavização exponencial tripla é dada pelas fórmulas onde está o fator de suavização de dados. 0160lt160160lt1601, é o fator de suavização de tendência. 0160lt160160lt1601, e é o fator de suavização da mudança sazonal. 0160lt160160lt1601. A fórmula geral para a estimativa da tendência inicial b 0 é: Definir as estimativas iniciais para os índices sazonais c i para i 1,2. L é um pouco mais envolvido. Se N é o número de ciclos completos presentes nos seus dados, então: Note que A j é o valor médio de x no j ésimo ciclo de seus dados. ETS Editar editar Alteração de parâmetros Na prática, a média móvel fornecerá uma boa estimativa da média das séries temporais se a média for constante ou mudar lentamente. No caso de uma média constante, o maior valor de m dará as melhores estimativas da média subjacente. Um período de observação mais longo medirá os efeitos da variabilidade. O objetivo de fornecer um m menor é permitir que a previsão responda a uma mudança no processo subjacente. Para ilustrar, propomos um conjunto de dados que incorpora mudanças na média subjacente das séries temporais. A figura mostra a série de tempo usada para ilustração juntamente com a demanda média a partir da qual a série foi gerada. A média começa como uma constante em 10. Começando no tempo 21, ele aumenta em uma unidade em cada período até atingir o valor de 20 no tempo 30. Então ele se torna constante novamente. Os dados são simulados adicionando à média um ruído aleatório de uma distribuição Normal com média zero e desvio padrão 3. Os resultados da simulação são arredondados para o número inteiro mais próximo. A tabela mostra as observações simuladas usadas para o exemplo. Quando usamos a tabela, devemos lembrar que a qualquer momento, apenas os dados passados são conhecidos. As estimativas do parâmetro do modelo, para três valores diferentes de m, são mostradas juntamente com a média das séries temporais na figura abaixo. A figura mostra a estimativa média móvel da média em cada momento e não a previsão. As previsões mudariam as curvas da média móvel para a direita por períodos. Uma conclusão é imediatamente aparente a partir da figura. Para as três estimativas, a média móvel está aquém da tendência linear, com o atraso aumentando com m. O atraso é a distância entre o modelo ea estimativa na dimensão temporal. Devido ao atraso, a média móvel subestima as observações à medida que a média está aumentando. O viés do estimador é a diferença em um tempo específico no valor médio do modelo eo valor médio predito pela média móvel. O viés quando a média está aumentando é negativo. Para uma média decrescente, o viés é positivo. O atraso no tempo e o viés introduzido na estimativa são funções de m. Quanto maior o valor de m. Maior a magnitude do atraso e do viés. Para uma série de crescimento contínuo com tendência a. Os valores de lag e viés do estimador da média são dados nas equações abaixo. As curvas de exemplo não correspondem a essas equações porque o modelo de exemplo não está aumentando continuamente, em vez disso, ele começa como uma constante, muda para uma tendência e, em seguida, torna-se constante novamente. Também as curvas de exemplo são afetadas pelo ruído. A previsão média móvel de períodos no futuro é representada deslocando as curvas para a direita. O atraso e o viés aumentam proporcionalmente. As equações abaixo indicam o atraso e o viés de um período de previsão para o futuro quando comparado aos parâmetros do modelo. Novamente, essas fórmulas são para uma série de tempo com uma tendência linear constante. Não devemos nos surpreender com esse resultado. O estimador da média móvel baseia-se no pressuposto de uma média constante, eo exemplo tem uma tendência linear na média durante uma parte do período do estudo. Como as séries de tempo real raramente obedecerão exatamente aos pressupostos de qualquer modelo, devemos estar preparados para tais resultados. Podemos também concluir a partir da figura que a variabilidade do ruído tem o maior efeito para m menor. A estimativa é muito mais volátil para a média móvel de 5 do que a média móvel de 20. Temos os desejos conflitantes de aumentar m para reduzir o efeito da variabilidade devido ao ruído e diminuir m para tornar a previsão mais sensível às mudanças Em média O erro é a diferença entre os dados reais e o valor previsto. Se a série temporal é verdadeiramente um valor constante, o valor esperado do erro é zero ea variância do erro é composta por um termo que é uma função de e um segundo termo que é a variância do ruído,. O primeiro termo é a variância da média estimada com uma amostra de m observações, assumindo que os dados provêm de uma população com média constante. Este termo é minimizado fazendo-se o maior possível. Um grande m faz com que a previsão não responda a uma mudança nas séries temporais subjacentes. Para tornar a previsão responsiva às mudanças, queremos que m seja o menor possível (1), mas isso aumenta a variância do erro. A previsão prática requer um valor intermediário. Previsão com o Excel O suplemento de Previsão implementa as fórmulas de média móvel. O exemplo abaixo mostra a análise fornecida pelo add-in para os dados da amostra na coluna B. As 10 primeiras observações são indexadas -9 a 0. Em comparação com a tabela acima, os índices de período são deslocados por -10. As primeiras dez observações fornecem os valores de inicialização para a estimativa e são usados para calcular a média móvel para o período 0. A coluna MA (10) (C) mostra as médias móveis calculadas. O parâmetro de média móvel m está na célula C3. A coluna Fore (1) (D) mostra uma previsão para um período no futuro. O intervalo de previsão está na célula D3. Quando o intervalo de previsão é alterado para um número maior, os números na coluna Fore são deslocados para baixo. A coluna Err (1) (E) mostra a diferença entre a observação e a previsão. Por exemplo, a observação no tempo 1 é 6. O valor previsto a partir da média móvel no tempo 0 é 11.1. O erro é então -5.1. O desvio padrão eo Desvio Médio Médio (MAD) são calculados nas células E6 e E7 respectivamente.8.4 Modelos de média móvel Em vez de usar valores passados da variável de previsão em uma regressão, um modelo de média móvel usa erros de previsão passados em um modelo de regressão . Y e teta teta e dots theta e, onde et é ruído branco. Referimo-nos a isto como um modelo MA (q). É claro que não observamos os valores de et, então não é realmente regressão no sentido usual. Observe que cada valor de yt pode ser considerado como uma média móvel ponderada dos últimos erros de previsão. No entanto, os modelos de média móvel não devem ser confundidos com o alisamento médio móvel discutido no Capítulo 6. Um modelo de média móvel é usado para prever valores futuros, enquanto o alisamento médio móvel é usado para estimar o ciclo tendencial de valores passados. Figura 8.6: Dois exemplos de dados de modelos de média móvel com diferentes parâmetros. Esquerda: MA (1) com y t 20e t 0,8e t-1. Direita: MA (2) com y t e t - e t-1 0,8e t-2. Em ambos os casos, e t é normalmente distribuído ruído branco com média zero e variância um. A Figura 8.6 mostra alguns dados de um modelo MA (1) e um modelo MA (2). Alterando os parâmetros theta1, dots, thetaq resulta em diferentes padrões de séries temporais. Tal como acontece com modelos autorregressivos, a variância do termo de erro e só mudará a escala da série, não os padrões. É possível escrever qualquer modelo AR (p) estacionário como um modelo MA (infty). Por exemplo, usando a substituição repetida, podemos demonstrar isso para um modelo AR (1): begin yt amp phi1y et amp phi1 (phi1y e) amp phi12y phi1 e amp phi13y phi12e phi1 e amptext final Fornecido -1 lt phi1 lt 1, o valor de phi1k será menor à medida que k for maior. Assim, eventualmente, obtemos yt et phi1 e phi12 e phi13 e cdots, um processo MA (infty). O resultado inverso é válido se impomos algumas restrições nos parâmetros MA. Em seguida, o modelo MA é chamado invertible. Ou seja, que podemos escrever qualquer processo de MA (q) invertível como um processo AR (infty). Modelos Invertiveis não são simplesmente para nos permitir converter de modelos MA para modelos AR. Eles também têm algumas propriedades matemáticas que torná-los mais fáceis de usar na prática. As restrições de invertibilidade são semelhantes às restrições de estacionaridade. Para um modelo MA (1): -1lttheta1lt1. Para um modelo MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1-theta2 lt 1. Condições mais complicadas mantêm-se para qge3. Mais uma vez, R irá cuidar dessas restrições ao estimar os modelos. Previsão Básica Previsão refere-se ao processo de utilização de procedimentos estatísticos para prever os valores futuros de uma série temporal baseada em tendências históricas. Para as empresas, ser capaz de medir os resultados esperados para um determinado período de tempo é essencial para o gerenciamento de marketing, planejamento e finanças. Por exemplo, uma agência de publicidade pode querer utilizar previsões de vendas para identificar quais meses futuros podem exigir maiores despesas de marketing. As empresas também podem usar previsões para identificar quais vendedores atingiram suas metas esperadas para um trimestre fiscal. Há uma série de técnicas que podem ser utilizadas para gerar previsões quantitativas. Alguns métodos são bastante simples, enquanto outros são mais robustos e incorporam fatores exógenos. Independentemente do que é utilizado, o primeiro passo deve sempre ser visualizar os dados usando um gráfico de linha. Você quer considerar como a métrica muda ao longo do tempo, se há uma tendência distinta, ou se existem padrões distintos que são dignos de nota. Existem vários conceitos-chave que devemos estar cientes de quando se descrevem dados de séries temporais. Essas características irão informar como nós pré-processar os dados e selecionar a técnica de modelagem adequada e parâmetros. Em última análise, o objetivo é simplificar os padrões nos dados históricos, removendo as fontes conhecidas de variatiion e tornando os padrões mais consistentes em todo o conjunto de dados. Padrões mais simples geralmente levarão a previsões mais precisas. Tendência: existe uma tendência quando há um aumento ou diminuição de longo prazo nos dados. Sazonalidade: Um padrão sazonal ocorre quando uma série temporal é afetada por fatores sazonais, como a época do ano ou o dia da semana. Autocorrelação: Refere-se aos fenômenos pelos quais valores de Y no tempo t são impactados por valores anteriores de Y em t-i. Para encontrar a estrutura adequada de lag e a natureza dos valores auto correlacionados em seus dados, use a plotagem da função de autocorrelação. Estacionária: uma série de tempo é dita ser estacionária se não houver uma tendência sistemática, nenhuma mudança sistemática na variação, e se as variações estritamente periódicas ou seasonality não existem Técnicas de previsão quantitativas são baseadas geralmente na análise do reression ou em técnicas da série do tempo. Abordagens de regressão examinam a relação entre a variável prevista e outras variáveis explicativas usando dados transversais. Modelos de séries temporais usam dados históricos que foram coletados em intervalos regulares ao longo do tempo para que a variável alvo preveja seus valores futuros. Não há tempo para cobrir a teoria por trás de cada uma dessas abordagens neste post, então eu escolhi para cobrir conceitos de alto nível e fornecer código para realizar a previsão de séries temporais em R. Sugiro fortemente entender a teoria estatística por trás de uma técnica antes de executar o código. Primeiro, podemos usar a função ma no pacote de previsão para realizar a previsão usando o método da média móvel. Esta técnica estima valores futuros no tempo t pela média dos valores das séries temporais dentro de k períodos de t. Quando a série de tempo é estacionária, a média móvel pode ser muito eficaz como as observações estão próximas através do tempo. O smooting exponencial simples também é bom quando os dados não têm tendência ou padrões sazonais. Ao contrário de uma média móvel, esta técnica dá maior peso às observações mais recentes das séries temporais. No pacote de previsão, há uma função de previsão automática que será executada através de modelos possíveis e selecionar o modelo mais adequado dar os dados. Este poderia ser um modelo auto regressivo do primeiro oder (AR (1)), um modelo ARIMA com os valores corretos para p, d, e q, ou algo mais que é mais apropriado. Lá vai você, uma introdução básica não-técnica à previsão. Isto deve familiarizar-se com os conceitos-chave e como realizar algumas previsões básicas em R Nunca perca uma atualização Subscreva os R-blogueiros para receber e-mails com as últimas postagens R. (Você não verá esta mensagem novamente.)
No comments:
Post a Comment