Säsongsförhållanden i prognoser Säsongsloven avser de förändringar i efterfrågan som sker över året under en regelbunden årskurs. Det beror på olika faktorer som kan omfatta vanliga vädermönster, religiösa händelser, traditionella beteendemönster och skollov. När det finns markerad eller extrem säsong i efterfrågningsmönstret, kommer effektiviteten i hanteringen av den att ha störst inverkan på prognosnoggrannheten. Den andra sidan av ekvationen är att det är viktigt att inte bygga säsongsalder i prognosen om den inte existerar, eftersom det skulle ha negativ inverkan på prognosnoggrannheten. Så i data där förekomsten av säsonglighet är tvetydig är det viktigt att göra det bästa möjliga beslutet om huruvida man ska använda säsongsmässigt i prognosprocessen. Olika statistiska tester kan hjälpa till med detta. Beräkningsmetoder för säsongsmässighet Kanske är det enklaste sättet att ta hänsyn till säsongsmässigheten att göra prognosen på samma sätt som förra året. Detta är vanligtvis inte ett bra sätt att gå vidare eftersom försäljningen i fjol kan vara onormal av flera möjliga skäl. Populära tillvägagångssätt inkluderar procentandelen av årsmetoden eller skapandet av additiv säsongsfaktorer eller multiplicativa säsongsindex. När det gäller att beräkna multiplikativa säsongsindex är det ett antal olika metoder. Enkla tillvägagångssätt inkluderar säsongsmedel och förhållandet till centrerad glidande medelvärde. Andra metoder inkluderar fourieranalys, där olika sinus - och cosinusvågor kombineras för att representera säsongsmönstret. Seasonal Average Method Detta är en väldigt enkel metod. För det första beräknas den genomsnittliga försäljningen för varje säsong, t. ex. månad. Detta ger genomsnittet för januari, medeltalet för februari, etc. Den stora genomsnittet beräknas sedan som genomsnittet av säsongsmedelvärdena. Slutligen skapas säsongsindexen genom att dela varje säsongsmedel med medelvärdet. Indexen kommer att vara genomsnittliga 1,00. Denna enkla metod är bra när försäljningshistoriken är relativt stabil, dvs inte utsatt för stora förändringar i den underliggande nivån av efterfrågan över tiden. För data som är mindre stabila, kan förhållandet till centrerat glidande medelvärde, som beskrivs nedan, vara bättre. Förhållande till centrerad rörlig genomsnittsmetod Förhållandet till centrerat glidande medelvärde för beräkning av multiplicativa säsongsindex är en enkel beräkning som enkelt kan ställas in i Excel eller annan programvara. Följande exempel för månadsdata: Skapa en serie för centrerat årligt glidande medelvärde (CMA), t. ex. Börja med att sätta månadsgenomsnittet för 2009 mot juni 2009 etc. Beräkna en annan serie som förhållandet mellan försäljningen i en given månad till CMA den månaden, dvs förhållandet försäljnings-CMA. Beräkna säsongsindexen som genomsnittet av förhållandena per säsongsmånad, t. ex. säsongsindex för mars är medeltalet av kvoterna för mar-09, mar-10, mar-11, mar-12, mar-13 och mar-14. Justera indexen om det behövs för att säsongsindexen ska läggas till 12.00. Eftersom mitten av en 12-månaders kalender inte är juni eller juli, men i mitten av de två, innebär den traditionella metoden för steg 1. att man skapar två serier för CMA. Så i en serie sätter det årliga genomsnittet mot juni, i den andra mot juli. Då var de två CMA-serierna i genomsnitt för att skapa något som kunde sägas vara riktigt centrerat. I praktiken gör det lite skillnad med de flesta kommersiella data. Den enda nackdelen med den här metoden är att den behöver lite mer historisk data än den säsongsmässiga metoden. Minst tre år är nödvändigt. Datarensning och datavolatilitet Datasensning påverkar beräkningen av säsongsmässighet i den meningen att onormala data bör uteslutas från säsongberäkningen. Naturligtvis bör natursäsongen inte tolkas felaktigt som onormal försäljning, så det är meningen att datautrensning och säsongsberäkning är nära sammanhängande. Minst två års historisk data bör göras tillgängliga för beräkning av säsongsmässighet. Eftersom det kan vara nödvändigt att utesluta vissa uppgifter om det är onormalt är det vanligtvis lämpligt att inkludera minst tre eller fyra års information. Problemet med en hel del affärsprognoser är att det ofta finns en relativt kort period av konsekvent historia. Detta gör ofta säsongsanalysen något av en konst snarare än en exakt vetenskap. Olika metoder kan användas för att minska påverkan av flyktiga data vid beräkning av säsongsmässighet för prognoser och därigenom förbättra prognosnoggrannheten. Dessa inkluderar: gruppsäsongsindex (beräkning av index på aggregerad nivå) säsongsmässig förenkling (t. ex. användning av månatliga index för veckodata) säsongsminskning (även kallad säsongsdämpning) säsongsmässig utjämning (t. ex. i veckovisa och dagliga prognoser Problemen med en liten mängd historia och flyktiga data blir större när man flyttar från beräkning av månadsäsong till beräkning av veckovis säsong. Det blir mindre troligt att årliga händelser kommer att äga rum under samma kalenderperiod, så det kan behöva rensa dem de här fallen från försäljningshistoriken och lägga till framtida förekomster till prognosen som planerade händelser. Det finns ibland en extra cykel vecka inom månaden för att hantera. Med veckovis säsong ses ofta mycket återstående volatilitet i de index som beror på säsongsberäkningen så att de råa indexerna inte kan lita på. Så det finns ett större behov av att ändra indexen med hjälp av gruppens säsongsindex, säsongsförenkling eller säsongsmässig utjämning. Om det finns behov av en daglig prognos är det oftast bäst att först beräkna säsongsmässigheten med hjälp av veckovisa data och sedan närma sig resten av uppgiften genom att använda dagarsprofiler för att dela veckor till dagar. Spridningsrapportens genomförande av säsongsjustering och exponentiell utjämning Det är enkelt att utföra säsongsjustering och passa exponentiella utjämningsmodeller med Excel. Skärmbilderna och diagrammen nedan är hämtade från ett kalkylblad som har upprättats för att illustrera multiplicativ säsongsjustering och linjär exponentiell utjämning på följande kvartalsförsäljningsdata från Outboard Marine: För att få en kopia av kalkylarkfilen själv klickar du här. Den version av linjär exponentiell utjämning som kommer att användas här för demonstration är Brown8217s version, bara för att den kan implementeras med en enda kolumn med formler och det finns bara en utjämningskonstant för att optimera. Vanligtvis är det bättre att använda Holt8217s version som har separata utjämningskonstanter för nivå och trend. Prognosprocessen fortskrider enligt följande: (i) Första uppgifterna är säsongrensade (ii) så skapas prognoser för säsongrensade data via linjär exponentiell utjämning och (iii) slutligen är de säsongrensade prognoserna kvoterade för att få prognoser för den ursprungliga serien . Säsongsjusteringsprocessen utförs i kolumnerna D till G. Det första steget i säsongjustering är att beräkna ett centrerat glidande medelvärde (utfört här i kolumn D). Detta kan göras genom att ta medeltalet av två ettåriga medelvärden som kompenseras av en period i förhållande till varandra. (En kombination av två förskjutna medelvärden i stället för ett enda medel behövs för centreringsändamål när antalet årstider är jämnt.) Nästa steg är att beräkna förhållandet till glidande medelvärde, dvs. de ursprungliga uppgifterna dividerat med det rörliga genomsnittet i varje period - vilket görs här i kolumn E. (Detta kallas också kvotrend-cyclequot-komponenten i mönstret, i den mån trend - och konjunkturseffekter kan anses vara allt som förblir efter medeltal över en helårs värde av data. Naturligtvis kan förändringar från månad till månad som inte beror på säsongsmässighet bestämas av många andra faktorer, men tolvmånadersgenomsnittet släpper i stor utsträckning över dem.) Beräknat säsongsindex för varje säsong beräknas genom att medeltalvärdera alla förhållanden för den aktuella säsongen, vilket görs i cellerna G3-G6 med en AVERAGEIF-formel. Medelvärdena är sedan återkalnade så att de summeras till exakt 100 gånger antalet perioder i en säsong, eller 400 i detta fall, vilket görs i cellerna H3-H6. Nedan i kolumn F används VLOOKUP-formler för att infoga det lämpliga säsongsindexvärdet i varje rad i datatabellen, enligt kvartalet av det representerar. Det centrerade rörliga genomsnittet och de säsongrensade uppgifterna ser ut så här: Observera att det glidande medlet oftast ser ut som en mjukare version av den säsongrensade serien, och den är kortare i båda ändarna. Ett annat kalkylblad i samma Excel-fil visar appliceringen av den linjära exponentiella utjämningsmodellen till säsongrensade data, som börjar i kolumn G. Ett värde för utjämningskonstanten (alfa) anges ovanför prognoskolumnen (här i cell H9) och För enkelhets skyld tilldelas serienavnet quotAlpha. quot (namnet är tilldelat med kommandot quotInsertNameCreatequot.) LES-modellen initieras genom att de första två prognoserna ställs lika med det första verkliga värdet av den säsongrensade serien. Formeln som används här för LES-prognosen är recirkulär form av Brown8217s modell: Denna formel är inmatad i cellen som motsvarar den tredje perioden (här, cell H15) och kopieras därifrån. Observera att LES-prognosen för den aktuella perioden avser de två föregående observationerna och de två föregående prognosfelen, liksom värdet av alfa. Således avser prognosformeln i rad 15 endast data som var tillgängliga i rad 14 och tidigare. (Självklart, om vi ville använda enkla istället för linjär exponentiell utjämning, kunde vi istället ersätta SES-formeln. Vi kan också använda Holt8217s snarare än Brown8217s LES-modell, vilket skulle kräva ytterligare två kolumner med formler för att beräkna nivån och trenden som används i prognosen.) Felen beräknas i nästa kolumn (här kolumn J) genom att subtrahera prognoserna från de faktiska värdena. Roten medelkvadratfelet beräknas som kvadratroten av felets varians plus kvadraten av medelvärdet. (Detta följer av den matematiska identiteten: MSE VARIANCE (fel) (AVERAGE (fel)). 2.) Vid beräkning av medelvärdet och variansen av fel i denna formel är de två första perioderna uteslutna eftersom modellen inte faktiskt börjar prognosera tills den tredje perioden (rad 15 på kalkylbladet). Det optimala värdet av alfa kan hittas antingen genom att manuellt byta alfa tills den minsta RMSE finns, annars kan du använda quotSolverquot för att utföra en exakt minimering. Värdet av alfa som Solver hittat visas här (alfa0.471). Det är vanligtvis en bra idé att plotta felet i modellen (i transformerade enheter) och även att beräkna och plotta sina autokorrelationer vid lags på upp till en säsong. Här är en tidsserie-plot av de (säsongrensade) felen: Felautokorrelationerna beräknas med hjälp av funktionen CORREL () för att beräkna korrelationerna av felen med sig självfördröjda av en eller flera perioder - detaljer visas i kalkylbladsmodellen . Här är en plot av autokorrelationerna av felen vid de första fem lagsna: Autokorrelationerna på lags 1 till 3 ligger mycket nära noll, men spetsen vid lag 4 (vars värde är 0,35) är lite besvärligt - det tyder på att säsongsjusteringsprocessen har inte varit helt framgångsrik. Det är emellertid faktiskt endast marginellt signifikant. 95 signifikansband för att testa om autokorrelationer skiljer sig signifikant från noll är ungefär plus-eller-minus 2SQRT (n-k), där n är provstorleken och k är fördröjningen. Här är n 38 och k varierar från 1 till 5, så kvadratroten-av-n-minus-k är omkring 6 för dem alla, och gränserna för att testa den statistiska signifikansen av avvikelser från noll är därför ungefär plus - eller-minus 26 eller 0,33. Om du varierar värdet av alfa för hand i denna Excel-modell kan du observera effekten på tidsserierna och autokorrelationsdiagrammen för felen, liksom på det roten-kvadratiska felet, vilket kommer att illustreras nedan. Nedan i kalkylbladet är prognostiseringsformeln quotbootstrappedquot in i framtiden genom att bara ersätta prognoser för faktiska värden vid den punkt där den faktiska data löper ut - det vill säga. där quotthe futurequot börjar. (Med andra ord, i varje cell där ett framtida datavärde skulle inträffa införs en cellreferens som pekar på prognosen för den perioden.) Alla övriga formler kopieras helt enkelt ovanifrån: Observera att fel för prognoser för framtiden beräknas alla vara noll. Det betyder inte att de faktiska felen kommer att vara noll, men snarare återspeglar den bara det faktum att vi förutspår att framtida data kommer att motsvara prognoserna i genomsnitt. De resulterande LES-prognoserna för säsongrensade data ser så här ut: Med detta speciella värde av alfa, vilket är optimalt för prognoser med en period framåt, är den prognostiserade trenden något uppåt, vilket återspeglar den lokala trenden som observerades under de senaste 2 åren eller så. För andra värden av alfa kan en väldigt annorlunda trendprojektion erhållas. Det är vanligtvis en bra idé att se vad som händer med den långsiktiga trendprojektionen när alfa varieras, eftersom det värde som är bäst för kortsiktiga prognoser inte nödvändigtvis är det bästa värdet för att förutsäga den mer avlägsna framtiden. Till exempel är här resultatet som erhålls om värdet av alfa manuellt ställs in på 0,25: Den prognostiserade långsiktiga trenden är nu negativ snarare än positiv. Med ett mindre värde av alfa lägger modellen större vikt vid äldre data i dess uppskattning av nuvarande nivå och trend och dess långsiktiga prognoser speglar den nedåtgående trend som observerats under de senaste 5 åren snarare än den senaste uppåtgående trenden. Detta diagram illustrerar också tydligt hur modellen med ett mindre värde av alfa är långsammare att svara på quotturning pointsquot i data och tenderar därför att göra ett fel på samma tecken under många perioder i rad. Dess 1-stegs prognosfel är större i genomsnitt än de som erhållits tidigare (RMSE på 34,4 i stället för 27,4) och starkt positivt autokorrelerade. Lag-1 autokorrelationen 0,56 överstiger väsentligen värdet 0,33, beräknat ovan för en statistiskt signifikant avvikelse från noll. Som ett alternativ till att sänka värdet av alfa för att introducera mer konservatism i långsiktiga prognoser, läggs en kvotränningsdämpningsquot-faktor ibland till modellen för att den planerade trenden ska flata ut efter några perioder. Det sista steget i att bygga prognosmodellen är att quoteraasonizequot LES prognoserna genom att multiplicera dem med lämpliga säsongsindex. De resesaliserade prognoserna i kolumn I är alltså helt enkelt produkten av säsongsindexen i kolumn F och de säsongrensade LES-prognoserna i kolumn H. Det är relativt lätt att beräkna konfidensintervaller för enstegsprognoser som gjorts av denna modell: först beräkna RMSE (root-mean-squared-felet, vilket är bara kvadratroten till MSE) och beräkna sedan ett konfidensintervall för den säsongrensade prognosen genom att lägga till och subtrahera två gånger RMSE. (Generellt är ett 95 konfidensintervall för en prognos för en period framåt ungefär lika med punktprognosen plus-eller-minus-två gånger den beräknade standardavvikelsen för prognosfel, förutsatt att felfördelningen är ungefär normal och provstorleken är tillräckligt stor, säg 20 eller mer. Här är RMSE istället för standardavvikelsen för provets standardavvikelse den bästa uppskattningen av standardavvikelsen för framtida prognosfel eftersom det tar hänsyn både till slumpmässiga variationer.) Förtroendebegränsningarna för den säsongrensade prognosen återförsäljas sedan. tillsammans med prognosen, genom att multiplicera dem med lämpliga säsongsindex. I detta fall är RMSE lika med 27,4 och den säsongrensade prognosen för den första framtida perioden (dec-93) är 273,2. så är det säsongrensade 95 konfidensintervallet från 273,2-227,4 218,4 till 273,2227,4 328,0. Multiplicera dessa gränser med Decembers säsongsindex på 68,61. vi uppnår lägre och övre konfidensgränser på 149,8 och 225,0 kring prognosen för 93-procentiga prognoser på 187,4. Förtroendebegränsningar för prognoser mer än en period framöver kommer i allmänhet att öka som prognoshorisonten ökar på grund av osäkerhet om nivå och trend samt säsongsfaktorer, men det är svårt att beräkna dem generellt med analytiska metoder. (Det lämpliga sättet att beräkna konfidensgränser för LES-prognosen är att använda ARIMA-teorin, men osäkerheten i säsongsindex är en annan fråga.) Om du vill ha ett realistiskt konfidensintervall för en prognos mer än en period framåt, tar du alla källor till felaktigt är det bästa sättet att använda empiriska metoder: till exempel för att få ett konfidensintervall för en 2-stegs prognos, kan du skapa en annan kolumn i kalkylbladet för att beräkna en prognos för två steg före varje period ( genom att förstärka prognosen med ett steg framåt). Beräkna sedan RMSE för de tvåstegsprognosprognosfel och använd detta som grund för ett konfidensintervall med två steg framåt. När du räknar ett löpande glidande medelvärde, är det genomsnittligt att placera genomsnittet i mellantidstiden i det föregående exemplet vi beräknade genomsnittet av de första 3 tidsperioderna och placerade det bredvid period 3. Vi kunde ha placerat medelvärdet mitt i tidsintervallet av tre perioder, det vill säga bredvid period 2. Detta fungerar bra med udda tidsperioder , men inte så bra för jämn tid. Så var skulle vi placera det första glidande medlet när M 4 Tekniskt sett skulle det rörliga genomsnittet falla vid t 2.5, 3.5. För att undvika detta problem släpper vi MAs med M 2. Således släpper vi de släta värdena Om vi i genomsnitt ett jämnt antal termer behöver vi släta de jämnda värdena Följande tabell visar resultaten med M 4.
No comments:
Post a Comment