Arima glidande medelvärde


Autoregressivt integrerat rörligt medelvärde - ARIMA DEFINITION av autoregressivt integrerat rörligt medelvärde - ARIMA En statistisk analysmodell som använder tidsseriedata för att förutsäga framtida trender. Det är en form av regressionsanalys som syftar till att förutsäga framtida rörelser längs den till synes slumpmässiga promenad som tagits av aktier och finansmarknaden genom att undersöka skillnaderna mellan värden i serien istället för att använda de faktiska datavärdena. Lags av de olika serierna kallas autoregressiva och lags inom prognostiserad data kallas glidande medelvärde. BREAKER NED Autoregressivt integrerat rörligt medelvärde - ARIMA Denna modelltyp kallas generellt ARIMA (p, d, q), med heltal som hänvisar till den autoregressiva. integrerade och rörliga genomsnittliga delar av datasatsen. ARIMA modellering kan ta hänsyn till trender, säsongsmässighet. cykler, fel och icke-stationära aspekter av en dataset vid prognoser. Introduktion till ARIMA: icke-säsongsmodeller ARIMA (p, d, q) prognoser ekvation: ARIMA-modeller är i teorin den vanligaste klassen av modeller för att förutse en tid serie som kan göras för att vara 8220stationary8221 genom differentiering (om nödvändigt), kanske i samband med olinjära transformationer såsom loggning eller deflatering (om nödvändigt). En slumpmässig variabel som är en tidsserie är stationär om dess statistiska egenskaper är konstanta över tiden. En stationär serie har ingen trend, dess variationer kring dess medelvärde har en konstant amplitud, och det vinklar på ett konsekvent sätt. d. v.s. dess kortsiktiga slumpmässiga tidsmönster ser alltid ut i statistisk mening. Det sistnämnda tillståndet betyder att dess autokorrelationer (korrelationer med sina egna tidigare avvikelser från medelvärdet) förblir konstanta över tiden, eller likvärdigt, att dess effektspektrum förblir konstant över tiden. En slumpmässig variabel i denna blankett kan ses som en kombination av signal och brus, och signalen (om en är uppenbar) kan vara ett mönster av snabb eller långsam mean reversion eller sinusformig oscillation eller snabb växling i tecken , och det kan också ha en säsongskomponent. En ARIMA-modell kan ses som en 8220filter8221 som försöker separera signalen från bruset, och signalen extrapoleras därefter i framtiden för att få prognoser. ARIMA-prognosekvationen för en stationär tidsserie är en linjär (d. v.s. regressionstyp) ekvation där prediktorerna består av lags av de beroende variabla andorlagren av prognosfel. Det vill säga: Förutsatt värdet på Y är en konstant och en viktad summa av ett eller flera nya värden av Y och eller en vägd summa av ett eller flera nya värden av felen. Om prediktorerna endast består av fördröjda värden på Y. Det är en ren autoregressiv (8220self-regressed8221) modell, som bara är ett speciellt fall av en regressionsmodell och som kan förses med standard regressionsprogram. Exempelvis är en första-order-autoregressiv (8220AR (1) 8221) modell för Y en enkel regressionsmodell där den oberoende variabeln bara Y är försenad med en period (LAG (Y, 1) i Statgraphics eller YLAG1 i RegressIt). Om en del av prediktorerna är felaktiga, är en ARIMA-modell inte en linjär regressionsmodell, eftersom det inte går att ange 8220last period8217s error8221 som en oberoende variabel: felen måste beräknas periodvis när modellen är monterad på data. Tekniskt sett är problemet med att använda fördröjda fel som prediktorer att modellen8217s förutsägelser inte är linjära funktioner för koefficienterna. även om de är linjära funktioner av tidigare data. Så koefficienter i ARIMA-modeller som innehåller försenade fel måste uppskattas genom olinjära optimeringsmetoder (8220hill-climbing8221) istället för att bara lösa ett system av ekvationer. Akronymet ARIMA står för Auto-Regressive Integrated Moving Average. Lags av den stationära serien i prognosen ekvationen kallas quotautoregressivequot termer, lags av prognosfel kallas quotmoving averagequot termer och en tidsserie som behöver differentieras för att göras stationär sägs vara en quotintegratedquot-version av en stationär serie. Slumpmässiga och slumpmässiga modeller, autoregressiva modeller och exponentiella utjämningsmodeller är alla speciella fall av ARIMA-modeller. En nonseasonal ARIMA-modell klassificeras som en quotARIMA (p, d, q) kvotmodell där: p är antalet autoregressiva termer, d är antalet icke-säsongsskillnader som behövs för stationaritet och q är antalet fördröjda prognosfel i prediksionsekvationen. Prognosekvationen är konstruerad enligt följande. Först, låt y beteckna d: s skillnad på Y. Det betyder: Observera att den andra skillnaden i Y (d2-fallet) inte är skillnaden från 2 perioder sedan. Det är snarare den första skillnaden-av-första skillnaden. vilken är den diskreta analogen av ett andra derivat, dvs den lokala accelerationen av serien i stället för dess lokala trend. När det gäller y. Den allmänna prognostiseringsekvationen är: Här definieras de rörliga genomsnittsparametrarna (9528217s) så att deras tecken är negativa i ekvationen, enligt konventionen införd av Box och Jenkins. Vissa författare och programvara (inklusive R-programmeringsspråket) definierar dem så att de har plustecken istället. När faktiska siffror är anslutna till ekvationen finns det ingen tvetydighet, men det är viktigt att veta vilken konvention din programvara använder när du läser utmatningen. Ofta anges parametrarna av AR (1), AR (2), 8230 och MA (1), MA (2), 8230 etc. För att identifiera lämplig ARIMA-modell för Y. börjar du med att bestämma sorteringsordningen (d) behöver stationera serierna och ta bort säsongens bruttoegenskaper, kanske i kombination med en variationsstabiliserande transformation, såsom loggning eller avflöde. Om du slutar vid denna tidpunkt och förutsäger att den olika serien är konstant, har du bara monterat en slumpmässig promenad eller slumpmässig trendmodell. Den stationära serien kan emellertid fortfarande ha autokorrelerade fel, vilket tyder på att vissa antal AR-termer (p 8805 1) och eller några nummer MA-termer (q 8805 1) också behövs i prognosekvationen. Processen att bestämma värdena p, d och q som är bäst för en given tidsserie kommer att diskuteras i senare avsnitt av anteckningarna (vars länkar finns längst upp på denna sida), men en förhandsvisning av några av de typerna av nonseasonal ARIMA-modeller som vanligtvis förekommer ges nedan. ARIMA (1,0,0) första ordningens autoregressiva modell: Om serien är stationär och autokorrelerad kanske den kan förutsägas som en multipel av sitt eget tidigare värde plus en konstant. Prognosekvationen i detta fall är 8230, som Y är regresserad i sig själv fördröjd med en period. Detta är en 8220ARIMA (1,0,0) constant8221 modell. Om medelvärdet av Y är noll, skulle den konstanta termen inte inkluderas. Om lutningskoefficienten 981 1 är positiv och mindre än 1 i storleksordningen (den måste vara mindre än 1 i storleksordningen om Y är stillastående), beskriver modellen medelåterkallande beteende där nästa period8217s värde bör förutses vara 981 1 gånger som långt ifrån medelvärdet som detta period8217s värde. Om 981 1 är negativ förutspår det medelåterkallande beteende med teckenväxling, dvs det förutspår också att Y kommer att ligga under den genomsnittliga nästa perioden om den är över medelvärdet denna period. I en andra-ordningsautoregressiv modell (ARIMA (2,0,0)) skulle det finnas en Y t-2 term till höger också, och så vidare. Beroende på tecken och storheter på koefficienterna kan en ARIMA (2,0,0) modell beskriva ett system vars medföljande reversering sker på ett sinusformigt oscillerande sätt, som en massans rörelse på en fjäder som utsätts för slumpmässiga stötar . ARIMA (0,1,0) slumpmässig promenad: Om serien Y inte är stillastående är den enklaste möjliga modellen för en slumpmässig promenadmodell, vilken kan betraktas som ett begränsande fall av en AR (1) - modell där den autogegrativa koefficienten är lika med 1, det vill säga en serie med oändligt långsam medelbackning. Förutsägningsekvationen för denna modell kan skrivas som: där den konstanta termen är den genomsnittliga period-till-period-förändringen (dvs. den långsiktiga driften) i Y. Denna modell kan monteras som en icke-avlyssningsregressionsmodell där första skillnaden i Y är den beroende variabeln. Eftersom den innehåller (endast) en nonseasonal skillnad och en konstant term, klassificeras den som en quotARIMA (0,1,0) modell med constant. quot. Den slumpmässiga walk-without-drift-modellen skulle vara en ARIMA (0,1, 0) modell utan konstant ARIMA (1,1,0) annorlunda första ordningens autoregressiva modell: Om fel i en slumpmässig promenadmodell är autokorrelerade kanske problemet kan lösas genom att lägga en lag av den beroende variabeln till prediktionsekvationen - - ie genom att regressera den första skillnaden av Y på sig själv fördröjd med en period. Detta skulle ge följande förutsägelsesekvation: som kan omordnas till Detta är en förstaordens autregressiv modell med en ordning av icke-säsongsskillnader och en konstant term, dvs. en ARIMA (1,1,0) modell. ARIMA (0,1,1) utan konstant enkel exponentiell utjämning: En annan strategi för korrigering av autokorrelerade fel i en slumpmässig promenadmodell föreslås av den enkla exponentiella utjämningsmodellen. Minns att för några icke-stationära tidsserier (t ex de som uppvisar bullriga fluktuationer kring ett långsamt varierande medelvärde), utförs slumpmässiga promenadmodellen inte lika bra som ett glidande medelvärde av tidigare värden. Med andra ord, istället för att ta den senaste observationen som prognosen för nästa observation, är det bättre att använda ett genomsnitt av de sista observationerna för att filtrera bort bullret och mer exakt uppskatta det lokala medelvärdet. Den enkla exponentiella utjämningsmodellen använder ett exponentiellt vägt glidande medelvärde av tidigare värden för att uppnå denna effekt. Förutsägningsekvationen för den enkla exponentiella utjämningsmodellen kan skrivas i ett antal matematiskt ekvivalenta former. varav den ena är den så kallade 8220error correction8221-formen, där den föregående prognosen justeras i riktning mot det fel som det gjorde: Eftersom e t-1 Y t-1 - 374 t-1 per definition kan det skrivas om som : vilket är en ARIMA (0,1,1) - utan konstant prognosekvation med 952 1 1 - 945. Det innebär att du kan passa en enkel exponentiell utjämning genom att ange den som en ARIMA (0,1,1) modell utan konstant, och den uppskattade MA (1) - koefficienten motsvarar 1-minus-alfa i SES-formeln. Minns att i SES-modellen är den genomsnittliga åldern för data i prognoserna för 1-tiden framåt 1 945. Det betyder att de tenderar att ligga bakom trender eller vändpunkter med cirka 1 945 perioder. Det följer att den genomsnittliga åldern för data i de 1-prognos framåt av en ARIMA (0,1,1) utan konstant modell är 1 (1 - 952 1). Så, till exempel, om 952 1 0,8 är medelåldern 5. När 952 1 närmar sig 1 blir ARIMA (0,1,1) utan konstant modell ett mycket långsiktigt glidande medelvärde och som 952 1 närmar sig 0 blir det en slumpmässig promenad utan driftmodell. What8217s det bästa sättet att korrigera för autokorrelation: Lägg till AR-termer eller lägga till MA-termer I de tidigare två modellerna som diskuterats ovan fixades problemet med autokorrelerade fel i en slumpmässig promenadmodell på två olika sätt: genom att lägga till ett fördröjt värde av de olika serierna till ekvationen eller lägga till ett fördröjt värde av prognosfelet. Vilket tillvägagångssätt är bäst En tumregel för denna situation, som kommer att diskuteras mer i detalj senare, är att positiv autokorrelation vanligtvis behandlas bäst genom att addera en AR-term till modellen och negativ autokorrelation behandlas vanligtvis bäst genom att lägga till en MA term. I affärs - och ekonomiska tidsserier uppstår negativ autokorrelation ofta som en artefakt av differentiering. (I allmänhet minskar differentieringen positiv autokorrelation och kan även orsaka en växling från positiv till negativ autokorrelation.) Således används ARIMA (0,1,1) - modellen, i vilken skillnad åtföljs av en MA-term, oftare än en ARIMA (1,1,0) modell. ARIMA (0,1,1) med konstant enkel exponentiell utjämning med tillväxt: Genom att implementera SES-modellen som en ARIMA-modell får du viss flexibilitet. För det första får den uppskattade MA (1) - koefficienten vara negativ. Detta motsvarar en utjämningsfaktor som är större än 1 i en SES-modell, vilket vanligtvis inte är tillåtet med SES-modellproceduren. För det andra har du möjlighet att inkludera en konstant term i ARIMA-modellen om du vill, för att uppskatta en genomsnittlig trendfri noll. ARIMA-modellen (0,1,1) med konstant har förutsägelsesekvationen: Prognoserna från den här modellen är kvalitativt likartade som i SES-modellen, förutom att banan för de långsiktiga prognoserna typiskt är en sluttande linje (vars lutning är lika med mu) snarare än en horisontell linje. ARIMA (0,2,1) eller (0,2,2) utan konstant linjär exponentiell utjämning: Linjära exponentiella utjämningsmodeller är ARIMA-modeller som använder två icke-säsongsskillnader i samband med MA-termer. Den andra skillnaden i en serie Y är inte bara skillnaden mellan Y och sig själv i två perioder, men det är snarare den första skillnaden i den första skillnaden, dvs. Y-förändringen i Y vid period t. Således är den andra skillnaden av Y vid period t lika med (Y t - Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. En andra skillnad av en diskret funktion är analog med ett andra derivat av en kontinuerlig funktion: det mäter kvotccelerationquot eller quotcurvaturequot i funktionen vid en given tidpunkt. ARIMA-modellen (0,2,2) utan konstant förutspår att den andra skillnaden i serien motsvarar en linjär funktion av de två sista prognosfel: som kan omordnas som: där 952 1 och 952 2 är MA (1) och MA (2) koefficienter. Detta är en generell linjär exponentiell utjämningsmodell. väsentligen samma som Holt8217s modell, och Brown8217s modell är ett speciellt fall. Den använder exponentiellt vägda glidande medelvärden för att uppskatta både en lokal nivå och en lokal trend i serien. De långsiktiga prognoserna från denna modell konvergerar till en rak linje vars lutning beror på den genomsnittliga trenden som observerats mot slutet av serien. ARIMA (1,1,2) utan konstant dämpad trend linjär exponentiell utjämning. Denna modell illustreras i de bifogade bilderna på ARIMA-modellerna. Den extrapolerar den lokala trenden i slutet av serien men plattar ut på längre prognoshorisonter för att presentera en konservatismskampanj, en övning som har empiriskt stöd. Se artikeln om varför Damped Trend worksquot av Gardner och McKenzie och artikeln "Rulequot Rulequot" av Armstrong et al. för detaljer. Det är i allmänhet lämpligt att hålla fast vid modeller där minst en av p och q inte är större än 1, dvs försök inte passa en modell som ARIMA (2,1,2), eftersom det här sannolikt kommer att leda till övermontering och quotcommon-factorquot-problem som diskuteras närmare i noterna om den matematiska strukturen för ARIMA-modeller. Implementering av kalkylark: ARIMA-modeller som de som beskrivs ovan är enkla att implementera på ett kalkylblad. Förutsägningsekvationen är helt enkelt en linjär ekvation som refererar till tidigare värden av ursprungliga tidsserier och tidigare värden av felen. Således kan du ställa in ett ARIMA-prognoskalkylblad genom att lagra data i kolumn A, prognosformeln i kolumn B och felen (data minus prognoser) i kolumn C. Förutsättningsformeln i en typisk cell i kolumn B skulle helt enkelt vara ett linjärt uttryck som hänvisar till värden i föregående rader av kolumnerna A och C multiplicerat med lämpliga AR - eller MA-koefficienter lagrade i celler på annat håll på kalkylbladet. Allmänna säsongsbetonade ARIMA-modeller: (0,1,1) x (0,1,1 ) etc. Översikt över säsongsbetonad ARIMA-modellering: Den säsongsbetonade delen av en ARIMA-modell har samma struktur som den icke-säsongsbetonade delen: den kan ha en AR-faktor, en MA-faktor och en ordning med differentiering. I den säsongsmässiga delen av modellen arbetar alla dessa faktorer över multiplar av lag s (antalet perioder under en säsong). En säsongsbetonad ARIMA-modell klassificeras som en ARIMA-modell (p, d, q) x (P, D, Q), där Pnumber av säsongens autoregressiva (SAR) termer, Dnumber av säsongsskillnader, Qnumber med säsongsrörliga medelvärden Vid identifieringen av en säsongsmodell är det första steget att avgöra huruvida en säsongsskillnad behövs, förutom eller kanske istället för en säsongsbetonad skillnad. Du bör titta på tidsserier och ACF - och PACF-tomter för alla möjliga kombinationer av 0 eller 1 icke-säsongsskillnad och 0 eller 1 säsongsskillnad. Varning: Använd aldrig någonsin mer än en säsongsskillnad, eller mer än två totala skillnader (säsongsbetonad och utan säsong kombinerad). Om säsongsmönstret är både starkt och stabilt över tid (t. ex. högt på sommaren och lågt på vintern eller vice versa), ska du förmodligen använda en säsongsskillnad oavsett om du använder en säsongsmässig skillnad, eftersom det här kommer förhindra att säsongsmönstret avviker från de långsiktiga prognoserna. Låt oss lägga till detta i vår lista med regler för att identifiera modeller Regel 12: Om serien har ett starkt och konsekvent säsongsmönster, bör du använda en ordningsföljd av säsongsskillnader - men använd aldrig mer än en ordningsföljd av säsongsskillnader eller mer än 2 order av total differensiering (seasonalnasonasonal). Signaturen för rent SAR eller rent SMA-beteende liknar signaturen av rent AR eller rent MA-beteende, förutom att mönstret uppträder över multiplar av lag s i ACF och PACF. Till exempel har en ren SAR (1) - process spikar i ACF vid lags s, 2s, 3s, etc. medan PACF skärs av efter lag s. Omvänt har en ren SMA (1) - process spikar i PACF vid lags s, 2s, 3s, etc. medan ACF avbryts efter fördröjning s. En SAR-signatur uppträder vanligtvis när autokorrelationen under säsongperioden är positiv e, medan en SMA-signatur vanligtvis uppstår när säsongens autokorrelation är negativ. Därmed: Regel 13: Om autokorrelationen under säsongperioden är positiv. Överväg att lägga till en SAR-term i modellen. Om autokorrelationen under säsongperioden är negativ. överväg att lägga till en SMA-term i modellen. Försök att undvika att blanda SAR - och SMA-termer i samma modell och undvik att använda mer än något av något slag. Vanligtvis är en SAR (1) eller SMA (1) termen tillräcklig. Du kommer sällan att stöta på en äkta SAR (2) eller SMA (2) - process och har ännu sällan tillräckligt med data för att uppskatta 2 eller flera säsongskoefficienter utan att estimeringsalgoritmen kommer in i en kvotbackback loop. quot Även om en säsongsbetonad ARIMA-modell verkar ha bara några parametrar, kom ihåg att backforecasting kräver uppskattning av en eller två säsonger värt av implicita parametrar för att initiera den. Därför bör du ha minst 4 eller 5 säsonger av data för att passa en säsongsbetonad ARIMA-modell. Förmodligen är den mest använda säsongsmässiga ARIMA modellen modellen (0,1,1) x (0,1,1) - dvs. en MA (1) xSMA (1) modell med både säsongsbetonad och en säsongsbetonad skillnad. Detta är i grunden en kvotasonal exponentiell smoothingquot-modell. När säsongsbetonade ARIMA-modeller är utrustade med loggade data kan de spåra ett multiplicativt säsongsmönster. Exempel: Reviderad AUTOSALE-serie Minns att vi tidigare förutspådde försäljningsserien för detaljhandeln genom att använda en kombination av deflation, säsongjustering och exponentiell utjämning. Låt oss nu försöka montera samma serie med säsongsbetonade ARIMA-modeller, med samma samplingsdata från januari 1970 till maj 1993 (281 observationer). Som tidigare kommer vi att arbeta med deflaterad automatisk försäljning - dvs. vi kommer att använda serien AUTOSALECPI som ingångsvariabel. Här är tidsserierna och ACF - och PACF-diagrammen i den ursprungliga serien, vilka erhålls i prognosproceduren genom att plotta quotresidualsquot av en ARIMA (0,0,0) x (0,0,0) modell med konstant: The quotsuspension bridgequot mönster i ACF är typiskt för en serie som är både icke-stationär och starkt säsongsbetonad. Det är uppenbart att vi behöver minst en ordning med differentiering. Om vi ​​tar en icke-säsongsskillnad, är de motsvarande diagrammen följande: De olika serierna (resterna av en slumpmässig walk-on-growth-modell) ser mer eller mindre stationära ut, men det finns fortfarande mycket stark autokorrelation under säsongsperioden (lag 12). Eftersom säsongsmönstret är starkt och stabilt vet vi (från regel 12) att vi kommer att vilja använda en ordning med säsongsskillnader i modellen. Här ser du hur bilden ser ut efter en säsongsskillnad (endast): Den säsongsvariationerade serien visar ett mycket starkt mönster av positiv autokorrelation, vilket vi påminner om från vårt tidigare försök att passa en säsongsmässig slumpmässig promenadmodell. Det här kan vara en kvotens signaturquot - eller det kan signalera behovet av en annan skillnad. Om vi ​​tar både en säsongsmässig och icke-säsongsskillnad erhålls följande resultat: Det här är förstås de rester från den säsongsmässiga slumpmässiga trendmodellen som vi tidigare monterade på försäljningsdata. Vi ser nu telltale tecken på mild overdifferensiering. De positiva spikarna i ACF och PACF har blivit negativa. Vad är den korrekta ordningen för differentiering En ytterligare information som kan vara till hjälp är en beräkning av felstatistiken i serien på varje nivå av differentiering. Vi kan beräkna dessa genom att passa motsvarande ARIMA-modeller där endast differens används. De minsta felen, både i beräkningsperioden och i valideringsperioden, erhålls genom modell A, som använder en skillnad av varje typ. Detta, tillsammans med utseendet på tomterna ovan, föreslår starkt att vi bör använda både en säsongsbetonad och en nonseasonal skillnad. Observera att förutom den gratuösa konstanta termen är modell A SRT-modellen, medan modell B bara är SRW-modellen. Som vi noterade tidigare när man jämförde dessa modeller verkar SRT-modellen passa bättre än SRW-modellen. I analysen som följer kommer vi att försöka förbättra dessa modeller genom att lägga till säsongsbetonade ARIMA villkor. Återgå till början av sidan. Den ofta använda ARIMA-modellen (0,1,1) x (0,1,1): SRT-modellen plus MA (1) och SMA (1) termer Återgå till den sista uppsättningen diagram ovan, observera det med en skillnad på varje typ finns en negativ spik i ACF vid lag 1 och även en negativ spik i ACF vid lag 12. medan PACF visar ett mer gradvis citadecayotmönster i närheten av båda dessa lager. Genom att tillämpa våra regler för att identifiera ARIMA-modeller (specifikt regel 7 och regel 13) kan vi nu dra slutsatsen att SRT-modellen skulle förbättras genom att tillägga en MA (1) term och en SMA (1) term. Genom regel 5 utesluter vi också konstanten eftersom två order av differentiering är inblandade. Om vi ​​gör allt detta får vi modellen ARIMA (0,1,1) x (0,1,1). vilket är den vanligaste säsongsbetonade ARIMA-modellen. Dess prognosekvation är: där 952 1 är MA (1) - koefficienten och 920 1 (kapital theta-1) är SMA (1) - koefficienten. Observera att det här är bara den säsongsmässiga slumpmässiga trendmodellen som fancied-up genom att lägga till multiplar av felen vid lags 1, 12 och 13. Också observera att koefficienten för lag-13-felet är produkten av MA (1) och SMA (1) koefficienter. Denna modell är begreppsmässigt liknande Winters-modellen, eftersom den effektivt tillämpar exponentiell utjämning till nivå, trend och säsongssituation på en gång, även om den bygger på mer solida teoretiska fundament, särskilt när det gäller beräkning av konfidensintervall för långsiktiga prognoser. Dess kvarvarande tomter är i detta fall följande: Även om en liten mängd autokorrelation förblir vid lag 12 är det totala utseendet på tomterna bra. Modellerna som visar resultat visar att de uppskattade MA (1) och SMA (1) koefficienterna (erhållna efter 7 iterationer) är faktiskt signifikanta: Prognoserna från modellen liknar den säsongsmässiga slumpmässiga trendmodellen - dvs. de plockar upp säsongsmönstret och den lokala trenden i slutet av serien - men de är lite slätare eftersom både säsongsmönster och trend effektivt ses som medelvärde (i en exponentiell utjämning) över den sista några årstider: Vad gör den här modellen verkligen Du kan tänka på det på följande sätt. Först beräknar man skillnaden mellan varje monthly8217s värde och ett 8220 exponentialt viktat historiskt genomsnitt8221 för den månaden som beräknas genom att applicera exponentiell utjämning till värden som observerades under samma månad i tidigare år, där mängden utjämning bestäms av SMA (1 ) koefficienten. Då tillämpas det enbart exponentiell utjämning på dessa skillnader för att kunna förutse avvikelsen från det historiska genomsnittet som kommer att observeras nästa månad. Värdet av SMA (1) - koefficienten nära 1,0 tyder på att många säsonger av data används för att beräkna det historiska genomsnittet för en viss månad av året. Minns att en MA (1) - koefficient i en ARIMA-modell (0,1,1) motsvarar 1-minus-alfa i motsvarande exponentiell utjämningsmodell, och att medelåldern för data i en exponentiell utjämningsmodellprognos är 1 apha. SMA (1) - koefficienten har en liknande tolkning med avseende på medelvärden mellan säsonger. Här tyder sitt värde på 0,91 att medelåldern för de data som används för att uppskatta det historiska säsongsmönstret är lite mer än 10 år (nästan hälften av datasatsen), vilket innebär att ett nästan konstant säsongsmönster antas. Det mycket mindre värdet på 0,5 för MA (1) - koefficienten tyder på att relativt liten utjämning görs för att uppskatta den aktuella avvikelsen från det historiska genomsnittet för samma månad, så nästa månad8217s förutspådda avvikelse från dess historiska medelvärde kommer att ligga nära avvikelserna från det historiska genomsnittet som observerades under de senaste månaderna. ARIMA-modellen (1,0,0) x (0,1,0) med konstant: SRW-modell plus AR (1) termen Den tidigare modellen var en modell för säsongsrelaterad trend (SRT) finjusterad genom tillsats av MA 1) och SMA (1) koefficienter. En alternativ ARIMA-modell för denna serie kan erhållas genom att ersätta en AR (1) term för nonseasonal skillnaden - dvs. genom att lägga till en AR (1) term till serien SRM (Seasonal Random Walk). Detta kommer att göra det möjligt för oss att bevara säsongsmönstret i modellen samtidigt som den totala skillnaden sänks, vilket ökar stabiliteten hos trendprojektionerna om så önskas. (Minns det med en säsongsskillnad ensam, ser serien ut en stark AR (1) signatur.) Om vi ​​gör det får vi en ARIMA (1,0,0) x (0,1,0) modell med konstant, vilket ger följande resultat: AR-koefficienten är verkligen mycket signifikant, och RMSE är bara 2,06 jämfört med 3,00 för SRW-modellen (modell B i jämförelsesrapporten ovan). Prognosekvationen för denna modell är: Tilläggstiden på högra sidan är en multipel av säsongsskillnaden observerad under den senaste månaden, vilket medför att korrigeringen av effekten av ett ovanligt gott eller dåligt år korrigeras. Här betecknar 981 1 AR (1) - koefficienten, vars uppskattade värde är 0,73. Om till exempel om försäljningen förra månaden var X dollar före försäljningen ett år tidigare, skulle kvantiteten 0,73X läggas till prognosen för denna månad. 956 betecknar CONSTANT i prognosekvationen, vars uppskattade värde är 0,20. Den uppskattade MEAN, vars värde är 0,75, är medelvärdet för den säsongsvariationerade serien, vilket är den årliga trenden i de långsiktiga prognoserna för denna modell. Konstanten är (per definition) lika med medeltiderna 1 minus AR (1) - koefficienten: 0,2 0,75 (1 8211 0,73). Prognosplotten visar att modellen verkligen gör ett bättre jobb än SRW-modellen för att spåra cykliska förändringar (dvs ovanligt bra eller dåliga år): MSE för denna modell är dock fortfarande betydligt större än vad vi fick för ARIMA (0, 1,1) x (0,1,1) modell. Om vi ​​tittar på rester av rester ser vi utrymme för förbättringar. Resterna visar fortfarande ett tecken på cyklisk variation: ACF och PACF föreslår behovet av både MA (1) och SMA (1) koefficienter: En förbättrad version: ARIMA (1,0,1) x (0,1,1) med konstant Om vi ​​lägger till de angivna MA (1) och SMA (1) termerna till föregående modell, erhåller vi en ARIMA (1,0,1) x (0,1,1) modell med konstant vars prognosförening är This är nästan detsamma som ARIMA-modellen (0,1,1) x (0,1,1), förutom att den ersätter den icke-säsongsskillnad med en AR (1) term (en kvotentialskillnad) och den innehåller en konstant term som representerar långsiktig trend. Därför antar denna modell en mer stabil trend än ARIMA-modellen (0,1,1) x (0,1,1), och det är den huvudsakliga skillnaden mellan dem. De modellanpassade resultaten är följande: Observera att den uppskattade AR (1) - koefficienten (981 1 i modellekvationen) är 0,96, som ligger mycket nära 1,0 men inte så nära att det föreslås att det absolut borde ersättas med en första skillnad: dess standardfel är 0,02, så det är ca 2 standardfel från 1.0. Den andra statistiken av modellen (de uppskattade MA (1) och SMA (1) koefficienterna och felstatistiken i estimerings - och valideringsperioderna är annars nästan identiska med de för ARIMA (0,1,1) x (0,1 , 1) modell. (De uppskattade MA (1) och SMA (1) koefficienterna är 0,45 och 0,91 i denna modell vs 0,48 och 0,91 i den andra.) Den uppskattade MEAN på 0,68 är den förutsagda långsiktiga trenden (genomsnittlig årlig ökning). Detta är i huvudsak samma värde som erhölls i (1,0,0) x (0,1,0) - med-konstant modell. Standardfelet för det uppskattade medelvärdet är 0,26, så skillnaden mellan 0,75 och 0,68 är inte signifikant. Om konstanten inte inkluderades i den här modellen skulle den vara en dämpad trendmodell: trenden i de mycket långsiktiga prognoserna skulle gradvis utplansas. Punktprognoserna från denna modell ser ganska ut som de som är av typen 0,1,1 (0,1,1), eftersom den genomsnittliga trenden liknar den lokala trenden i slutet av serien. Förtroendeintervallet för denna modell utökas dock något mindre på grund av antagandet att trenden är stabil. Observera att konfidensgränserna för de tvååriga prognoserna nu ligger inom de horisontella rutorna vid 24 och 44, medan de av modellen (0,1,1) x (0,1,1) inte var: Säsongens ARIMA jämfört med exponentiell utjämning och säsongjustering: Nu kan vi jämföra prestanda de två bästa ARIMA-modellerna mot enkla och linjära exponentiella utjämningsmodeller tillsammans med multiplicativ säsongjustering och Winters-modellen, som visas i bilderna på prognoser med säsongsjustering: Felstatistiken för Prognoserna för alla framtidsprognoser är extremt nära i det här fallet. Det är svårt att välja en 8220winner8221 baserat på dessa siffror ensamma. Återgå till början av sidan. Vilka är skillnaderna mellan de olika säsongsmodellerna De tre modellerna som använder multiplicativ säsongsjustering handlar om säsongsmässighet på ett tydligt sätt - dvs. säsongens index bryts ut som en explicit del av modellen. ARIMA-modellerna hanterar säsongsmässigt på ett mer implisitt sätt - vi kan inte se i ARIMA-produktionen hur genomsnittet i december säger, skiljer sig från medeltalet juli. Beroende på om det anses viktigt att isolera säsongsmönstret kan detta vara en faktor vid valet mellan olika modeller. ARIMA-modellerna har fördelen att de, när de initialiseras, har färre kvoter än de exponentiella utjämnings - och justeringsmodellerna, och som sådana kan de vara mindre benägna att överföra data. ARIMA-modellerna har också en mer solid underliggande teori med avseende på beräkningen av konfidensintervaller för längre horisontprognoser än de andra modellerna. Det finns mer dramatiska skillnader bland modellerna med avseende på beteendet hos sina prognoser och konfidensintervall för prognoser mer än en period framåt. Det är här de antaganden som görs med hänsyn till förändringar i trend och säsongsmönster är mycket viktiga. Mellan de två ARIMA-modellerna, beräknar en (modell A) en tidsvarierande trend, medan den andra (modell B) innehåller en långsiktig genomsnittlig trend. (Vi kunde, om vi önskade, utplåna den långsiktiga trenden i modell B genom att undertrycka den konstanta termen.) Bland modellerna för exponentiell utjämning plus plus antar en (modell C) en platt trend medan den andra modell D) antar en tidsvarierande trend. Wintersmodellen (E) antar också en tidsvarierande trend. Modeller som antar en konstant trend är relativt säkrare i sina långsiktiga prognoser än modeller som inte gör det, och det brukar återspeglas i hur mycket konfidensintervall för prognoser blir bredare vid längre prognoshorisonter. Modeller som inte antar tidsvarierande trender har vanligtvis smalare konfidensintervaller för längre horisontprognoser, men smalare är inte bättre om inte detta antagande är korrekt. De två exponentiella utjämningsmodellerna kombinerat med säsongsjustering förutsätter att säsongsmönstret har varit konstant under de 23 åren i dataprovet, medan de andra tre modellerna inte gör det. I den mån säsongsmönstret står för det mesta av månad till månadens variation i uppgifterna är det viktigt att förutse vad som kommer att hända flera månader in i framtiden. Om säsongsmönstret tros ha förändrats långsamt över tiden, skulle en annan metod vara att bara använda en kortare datalogik för att anpassa modellerna som uppskattar fasta säsongsindex. För rekordet är här prognoserna och 95 konfidensgränser för maj 1995 (24 månader framåt) som produceras av de fem modellerna: Poängprognoserna är faktiskt förvånansvärt nära varandra i förhållande till bredden av alla konfidensintervall. SES-poängprognosen är den lägsta, eftersom den är den enda modellen som inte antar en uppåtgående trend i slutet av serien. ARIMA (1,0,1) x (0,1,1) c-modellen har de minsta konfidensgränserna, eftersom det förutsätter mindre tidsvariation i parametrarna än de andra modellerna. Dessutom är dess prognosprognos något större än de andra modellernas, eftersom den extrapolerar en långsiktig trend snarare än en kortsiktig trend (eller ingen trend). Winters modellen är minst stabil i modellerna och dess prognos har därför de största konfidensgränserna, vilket framgår av detaljerade prognosplottor för modellerna. Och prognoserna och konfidensgränserna för ARIMA-modellen (0,1,1) x (0,1,1) och de av LESseasonaljusteringsmodellen är nästan identiska att logga eller inte logga någonting som vi ännu inte har gjort, men kan ha, är en logtransformation som en del av modellen. Seasonal ARIMA-modeller är i sig additiva modeller, så om vi vill fånga ett multiplicativt säsongsmönster. Vi måste göra det genom att logga in data innan du monterar ARIMA-modellen. (I Statgraphics skulle vi bara behöva ange kvadratisk Logquot som ett modelleringsalternativ - ingen stor sak.) I det här fallet verkar deflationstransformationen ha gjort ett tillfredsställande jobb för att stabilisera amplituden för säsongscyklerna, så det gör inte verkar vara en tvingande anledning att lägga till en loggförändring vad gäller långsiktiga trender. Om resterna visade en markant ökning av variationen över tiden, kan vi bestämma oss annars. Det är fortfarande fråga om huruvida felet i dessa modeller har en konsekvent varians över månaderna på året. Om de inte gör det, kan konfidensintervall för prognoser tendera att vara för breda eller för smala enligt säsongen. Resterande vs-tid-tomter visar inte ett uppenbart problem i detta avseende, men för att vara noggrann skulle det vara bra att titta på felvariationen per månad. Om det verkligen finns ett problem, kan en loggomvandling fixa den. Återgå till början av sidan.

Comments