Flytte Gjennomsnittet Prediksjon Feil
Flytte gjennomsnittlig prognose Innledning. Som du kanskje tror vi ser på noen av de mest primitive tilnærmingene til prognoser. Men forhåpentligvis er disse minst en verdig innføring i noen av databehandlingsproblemene knyttet til implementering av prognoser i regneark. I denne veinen vil vi fortsette med å starte i begynnelsen og begynne å jobbe med Moving Average prognoser. Flytte gjennomsnittlige prognoser. Alle er kjent med å flytte gjennomsnittlige prognoser, uansett om de tror de er. Alle studenter gjør dem hele tiden. Tenk på testresultatene dine i et kurs der du skal ha fire tester i løpet av semesteret. La oss anta at du fikk en 85 på din første test. Hva vil du forutsi for din andre testscore Hva tror du at læreren din ville forutse din neste testscore Hva tror du dine venner kan forutsi for neste testresultat Hva tror du at foreldrene dine kan forutsi for neste testresultat uansett alt det du kan gjøre med dine venner og foreldre, de og din lærer er veldig sannsynlig å forvente deg å få noe i området av 85 du nettopp har fått. Vel, nå kan vi anta at til tross for selvforfremmelse til vennene dine, overestimerer du deg selv og figurerer du kan studere mindre for den andre testen, og så får du en 73. Nå er det alle de bekymrede og ubekymrede går til Forvent deg at du kommer på den tredje testen. Det er to svært sannsynlige tilnærminger for dem å utvikle et estimat, uansett om de vil dele det med deg. De kan si til seg selv, at denne fyren alltid blåser røyk om hans smarts. Hes kommer til å få en annen 73 hvis han er heldig. Kanskje foreldrene vil prøve å være mer støttende og si, quote, så langt har du fått en 85 og en 73, så kanskje du burde finne på å få en (85 73) 2 79. Jeg vet ikke, kanskje hvis du gjorde mindre fest og werent vevet vasselen over alt, og hvis du begynte å gjøre mye mer å studere, kan du få en høyere score. quot Begge disse estimatene flytter faktisk gjennomsnittlige prognoser. Den første bruker bare din siste poengsum for å prognose din fremtidige ytelse. Dette kalles en flytende gjennomsnittlig prognose ved hjelp av en periode med data. Den andre er også en flytende gjennomsnittlig prognose, men bruker to perioder med data. La oss anta at alle disse menneskene bråser på ditt store sinn, har slags pisset deg av og du bestemmer deg for å gjøre det bra på den tredje testen av dine egne grunner og for å sette en høyere poengsum foran din quotalliesquot. Du tar testen og poengsummen din er faktisk en 89 Alle, inkludert deg selv, er imponert. Så nå har du den endelige testen av semesteret som kommer opp, og som vanlig føler du behovet for å få alle til å gjøre sine spådommer om hvordan du skal gjøre på den siste testen. Vel, forhåpentligvis ser du mønsteret. Nå, forhåpentligvis kan du se mønsteret. Hvilke tror du er den mest nøyaktige fløyten mens vi jobber. Nå går vi tilbake til vårt nye rengjøringsfirma som startes av din fremmedgjorte halv søster, kalt Whistle While We Work. Du har noen tidligere salgsdata som er representert av følgende del fra et regneark. Vi presenterer først dataene for en tre-års glidende gjennomsnittlig prognose. Oppføringen for celle C6 skal være Nå kan du kopiere denne celleformelen ned til de andre cellene C7 til C11. Legg merke til hvordan gjennomsnittet beveger seg over de nyeste historiske dataene, men bruker nøyaktig de tre siste perioder som er tilgjengelige for hver prediksjon. Du bør også legge merke til at vi ikke virkelig trenger å gjøre spådommene for de siste perioder for å utvikle vår siste prediksjon. Dette er definitivt forskjellig fra eksponentiell utjevningsmodell. Ive inkluderte quotpast predictionsquot fordi vi vil bruke dem på neste nettside for å måle prediksjonsgyldigheten. Nå vil jeg presentere de analoge resultatene for en to-års glidende gjennomsnittlig prognose. Oppføringen for celle C5 skal være Nå kan du kopiere denne celleformelen ned til de andre cellene C6 til C11. Legg merke til hvordan nå bare de to siste bitene av historiske data blir brukt for hver prediksjon. Igjen har jeg tatt med quotpast predictionsquot for illustrative formål og for senere bruk i prognose validering. Noen andre ting som er viktig å legge merke til. For en m-periode som beveger gjennomsnittlig prognose, brukes bare de nyeste dataverdiene for å gjøre prognosen. Ingenting annet er nødvendig. For en m-periode som beveger gjennomsnittlig prognose, legger du merke til at den første prediksjonen forekommer i periode m 1. Begge disse problemene vil være svært viktige når vi utvikler koden vår. Utvikle den bevegelige gjennomsnittsfunksjonen. Nå må vi utvikle koden for den bevegelige gjennomsnittlige prognosen som kan brukes mer fleksibelt. Koden følger. Legg merke til at inngangene er for antall perioder du vil bruke i prognosen og rekke historiske verdier. Du kan lagre den i hvilken arbeidsbok du vil ha. Funksjon MovingAverage (Historical, NumberOfPeriods) Som Single Deklarering og Initialisering av variabler Dim Item Som Variant Dim Counter Som Integer Dim Akkumulering Som Single Dim HistoricalSize Som Integer Initialiserende variabler Teller 1 Akkumulering 0 Bestemme størrelsen på Historical array HistoricalSize Historical. Count For Counter 1 To NumberOfPeriods Akkumulere riktig antall siste tidligere observerte verdier Akkumulasjonsakkumulering Historisk (HistoricalSize - NumberOfPeriods Counter) MovingAverage AkkumuleringsnummerOfPeriods Koden vil bli forklart i klassen. Du vil plassere funksjonen på regnearket slik at resultatet av beregningen vises der det skal like følgende.8.4 Flytte gjennomsnittlige modeller I stedet for å bruke tidligere verdier av prognosevariabelen i en regresjon, bruker en bevegelig gjennomsnittsmodell tidligere prognosefeil i en regresjonslignende modell. y c et theta e theta e dots theta e, hvor et er hvit støy. Vi refererer til dette som en MA (q) modell. Selvfølgelig observerer vi ikke verdiene til et, så det er ikke egentlig regresjon i vanlig forstand. Legg merke til at hver verdi av yt kan betraktes som et vektet glidende gjennomsnitt av de siste prognosefeilene. Imidlertid bør bevegelige gjennomsnittsmodeller ikke forveksles med flytende gjennomsnittsutjevning som vi diskuterte i kapittel 6. En flytende gjennomsnittsmodell brukes til å prognostisere fremtidige verdier mens flytende gjennomsnittsutjevning brukes til å estimere utviklingscyklusen til tidligere verdier. Figur 8.6: To eksempler på data fra bevegelige gjennomsnittsmodeller med forskjellige parametere. Venstre: MA (1) med y t 20e t 0.8e t-1. Høyre: MA (2) med y t e t-e t-1 0.8e t-2. I begge tilfeller er e t normalt distribuert hvit støy med gjennomsnittlig null og varians en. Figur 8.6 viser noen data fra en MA (1) modell og en MA (2) modell. Endring av parametrene theta1, prikker, thetaq resulterer i forskjellige tidsseriemønstre. Som med autoregressive modeller, vil variansen av feilbegrepet et bare endre omfanget av serien, ikke mønstrene. Det er mulig å skrive en stasjonær AR (p) modell som en MA (infty) modell. For eksempel ved bruk av gjentatt substitusjon, kan vi demonstrere dette for en AR (1) - modell: begynnelse og forsterkning og forsterkning (phi1y e) og forsterkning av phi1 og et phi13y phi12e phi1e og amplitud ende Forutsatt -1 lt phi1 lt 1, verdien av phi1k blir mindre etter hvert som k blir større. Så til slutt får vi yt og phi1 phi12 e phi13 e cdots, en MA (infty) prosess. Det motsatte resultatet holder seg dersom vi legger inn noen begrensninger på MA parametrene. Så kalles MA-modellen inverterbar. Det vil si at vi kan skrive en omvendt MA (q) prosess som en AR (infty) prosess. Invertible modeller er ikke bare å gjøre det mulig for oss å konvertere fra MA-modeller til AR-modeller. De har også noen matematiske egenskaper som gjør dem enklere å bruke i praksis. Invertibilitetsbegrensningene ligner stasjonære begrensninger. For en MA (1) modell: -1lttheta1lt1. For en MA (2) modell: -1lttheta2lt1, theta2theta1 gt-1, theta1-teteta1 1. Mer kompliserte forhold holder for qge3. Igjen vil R ta vare på disse begrensningene ved estimering av modellene. I praksis vil det bevegelige gjennomsnittet gi et godt estimat av gjennomsnittet av tidsserien hvis gjennomsnittet er konstant eller sakte endring. Ved konstant gjennomsnitt vil den største verdien av m gi de beste estimatene for det underliggende gjennomsnittet. En lengre observasjonsperiode vil gjennomsnittlig utvirke virkningen av variabilitet. Formålet med å gi en mindre m er å la prognosen svare på en endring i den underliggende prosessen. For å illustrere foreslår vi et datasett som inkorporerer endringer i det underliggende gjennomsnittet av tidsseriene. Figuren viser tidsseriene som brukes til illustrasjon sammen med den gjennomsnittlige etterspørselen fra hvilken serien ble generert. Middelet begynner som en konstant ved 10. Begynner på tid 21, øker den med en enhet i hver periode til den når verdien av 20 ved tid 30. Da blir det konstant igjen. Dataene blir simulert ved å legge til i gjennomsnitt, en tilfeldig støy fra en Normal-fordeling med null-middel og standardavvik 3. Resultatene av simuleringen avrundes til nærmeste heltall. Tabellen viser de simulerte observasjonene som brukes til eksemplet. Når vi bruker bordet, må vi huske at det til enhver tid bare er kjent med tidligere data. Estimatene til modellparameteren, for tre forskjellige verdier av m, vises sammen med gjennomsnittet av tidsseriene i figuren under. Figuren viser gjennomsnittlig glidende gjennomsnittlig beregning av gjennomsnittet hver gang og ikke prognosen. Prognosene ville skifte de bevegelige gjennomsnittskurver til høyre etter perioder. En konklusjon er umiddelbart tydelig fra figuren. For alle tre estimatene ligger det glidende gjennomsnittet bak den lineære trenden, idet laget øker med m. Laget er avstanden mellom modellen og estimatet i tidsdimensjonen. På grunn av lavet undervurderer det bevegelige gjennomsnittet observasjonene ettersom gjennomsnittet øker. Forskjellerens forspenning er forskjellen på en bestemt tid i middelverdien av modellen og middelverdien forutsatt av det bevegelige gjennomsnittet. Forspenningen når gjennomsnittet øker er negativt. For et avtagende middel er forspenningen positiv. Forsinkelsen i tid og bias innført i estimatet er funksjoner av m. Jo større verdien av m. jo større størrelsen på lag og forspenning. For en kontinuerlig økende serie med trend a. verdiene av lag og forspenning av estimatoren av middelet er gitt i ligningene nedenfor. Eksempelkurverne stemmer ikke overens med disse ligningene, fordi eksempelmodellen ikke øker kontinuerlig, men det begynner som en konstant, endrer seg til en trend og blir konstant igjen. Også eksempelkurvene påvirkes av støyen. Den bevegelige gjennomsnittlige prognosen for perioder inn i fremtiden er representert ved å flytte kurvene til høyre. Forsinkelsen og forspenningen øker proporsjonalt. Ligningene nedenfor angir lag og forspenning av prognoseperioder i fremtiden sammenlignet med modellparametrene. Igjen, disse formlene er for en tidsserie med en konstant lineær trend. Vi bør ikke bli overrasket over dette resultatet. Den bevegelige gjennomsnittlige estimatoren er basert på antagelsen om konstant gjennomsnitt, og eksemplet har en lineær trend i gjennomsnittet i en del av studieperioden. Siden sanntidsserier sjelden vil adlyde forutsetningene til en hvilken som helst modell, bør vi være forberedt på slike resultater. Vi kan også konkludere fra figuren at variasjonen av støyen har størst effekt for mindre m. Estimatet er mye mer flyktig for det bevegelige gjennomsnittet på 5 enn det bevegelige gjennomsnittet på 20. Vi har de motstridende ønskene om å øke m for å redusere effekten av variabilitet på grunn av støyen, og å redusere m for å gjøre prognosen mer lydhør for endringer i gjennomsnitt. Feilen er forskjellen mellom de faktiske dataene og den forventede verdien. Hvis tidsseriene er virkelig en konstant verdi, er den forventede verdien av feilen null og variansen av feilen består av et begrep som er en funksjon av og et andre begrep som er variansen av støyen. Første term er variansen av gjennomsnittet estimert med en prøve av m observasjoner, forutsatt at data kommer fra en befolkning med konstant gjennomsnitt. Denne termen er minimert ved å gjøre m så stor som mulig. Et stort m gjør prognosen uansvarlig for en endring i den underliggende tidsserien. For å gjøre prognosen lydhør for endringer, ønsker vi m så liten som mulig (1), men dette øker feilvariasjonen. Praktisk prognose krever en mellomverdi. Forecasting with Excel Forecasting-tillegget implementerer de bevegelige gjennomsnittlige formlene. Eksempelet nedenfor viser analysen som ble levert av tillegget for prøvedataene i kolonne B. De første 10 observasjonene er indeksert -9 til 0. Sammenlignet med tabellen over, forskyves periodindeksene med -10. De første ti observasjonene gir oppstartsverdiene for estimatet og brukes til å beregne det bevegelige gjennomsnittet for perioden 0. MA (10) kolonnen (C) viser de beregnede bevegelige gjennomsnittene. Den bevegelige gjennomsnittsparameteren m er i celle C3. Fore (1) kolonne (D) viser en prognose for en periode inn i fremtiden. Forespørselsintervallet er i celle D3. Når prognoseperioden endres til et større tall, blir tallene i Fore-kolonnen flyttet ned. Err-kolonnen (E) viser forskjellen mellom observasjonen og prognosen. For eksempel er observasjonen ved tidspunkt 1 6. Den prognostiserte verdien fra det bevegelige gjennomsnittet ved tid 0 er 11,1. Feilen er da -5,1. Standardavviket og gjennomsnittlig avvik (MAD) beregnes i henholdsvis celler E6 og E7. Forbedret prognoser med bevegelige gjennomsnitt og Z-score Andrew Creager 0 Forecasting er en integrert del av forretningsadministrasjonen. Jo bedre prognosen, jo bedre ledelse vil kunne planlegge for fremtiden. Selv om det er mange metoder for å lage prognoser, er noen bedre egnet enn andre for bestemte situasjoner. For kortsiktige prognoser kan Black Belts dra nytte av å analysere produksjonstrender og se etter spesielle årsaker til variasjon. Når man gjør langsiktige prognoser, kan en metode som bruker en normal kurve og Z-poeng være det bedre veddemål. Begge metodene er enkle å anvende. Metoder i praksis Følgende scenario gir en forståelse for hvordan disse metodene fungerer. I dette eksemplet ønsker en produksjonsleder, som nylig ble sertifisert som en svart belte, å bruke Six Sigma-verktøy og statistisk analyse-programvare for å gjøre spådommer. Lederen sporer avdelingen8217s ukentlige produksjon av paller. Hver palle har et konstant antall produkttilfeller, og lederen bruker et enkelt, fire ukers glidende gjennomsnitt i et regneark. Tabell 1 viser en prøve fra slutten av en 52-ukers syklus av avdeling8217s produksjon av paller. Tabell 1: Produksjon av pallettproduksjon i uken Lederen har de to grunnleggende ingrediensene som trengs for å generere prognoser: produksjonsdata og en prognoseperiode. Perioden, ordivisor, i dette tilfellet er uker. Med denne informasjonen kan hun utføre både kortsiktige og langsiktige prognosemetoder. Kort sikt: Leter du etter trender ved å flytte gjennomsnittlige tomter Statistisk programvare kan gi Black Belts med flere alternativer for å fullføre prognoser. I dette tilfellet, for en kortsiktig prediksjon, velger lederen å plotte det bevegelige gjennomsnittet ved å bruke en tidsseriekommando. For å gjøre dette, legger hun inn variabelen og lengden når den blir bedt om det. Figur 1: Fire uker flytende gjennomsnittsplott for pallproduksjon Figur 1 viser produksjonsleder8217s fire-ugers glidende gjennomsnitt fra det siste året som det ville vises i et program. Selv om den visuelle representasjonen av analysen er nyttig, er det sanne fokuset her nøyaktighetsmålingene, som representerer forskjellene mellom de faktiske og forventede pallmengder. En av disse nøyaktighetsmålingene er gjennomsnittlig absolutt avvik (MAD). Det styrker nøyaktigheten av de monterte tidsserieverdiene og uttrykker avviket i de samme enhetene som dataene, noe som gjør det lettere å forstå mengden feil. Formelen for MAD: hvor y er den faktiske verdien av gangen, y-hat er den monterte verdien og n er antall observasjoner. Tabell 2: MAD for ulike flytende gjennomsnittlige iterasjoner Lengde på flyttende gjennomsnitt Siden lederen ser etter en prognose med minst mulig prediksjonsfeil, er det best å iterere gjennom forskjellige lengder av det bevegelige gjennomsnittet for å finne lavere verdier av MAD. Tabell 2, til venstre, viser resultatene for fem forskjellige flytende gjennomsnittlige iterasjoner. Tabellen illustrerer at lederen ville ha en litt mer nøyaktig prognose med et fem - eller seks uker flytende gjennomsnitt. Når man undersøker grafen i figur 1, kan man også merke at det er ekstreme verdier ved punktene 40 og 45, og at de forutsagte verdiene hovedsakelig ble trukket ned rundt disse punktene. Dette bør skape interesse for videre gjennomgang. En vei til lederen kan gjennomføre denne vurderingen og vurdere effektene av de to ekstreme punktene er å plassere dataene i et individets kontrolldiagram, som vist i figur 2, og se om det er avvik utenfor de 3-sigma kontrollgrensene. Figur 2: Individuelt kontrollkart over produksjonspoeng 40 og 45 overstiger kontrollgrensene. Selvfølgelig er produksjonen ikke en enkelt prosess, og kan ikke styres bare ved å bruke statistisk prosesskontroll, men individet diagrammet er et kjent verktøy for Black Belts og kan gi verdifull innsikt for manager8217s prognose. Ved gjennomgang av punktene utenfor kontrollgrensene finner lederen en sannsynlig forklaring: De skjedde på to helligdager, Thanksgiving og jul, da avdelingen ble stengt i flere dager. Å vite dette fjerner lederen de to punktene fra datasettet og gjenoppretter de bevegelige gjennomsnittene for å se om MAD reduseres. Lederen finner at MAD reduseres etter å ha fjernet de to ekstreme punktene de oppdaterte dataene er vist i Tabell 3. Tabell 3: MAD for forskjellige flytende gjennomsnittlige iterasjoner etter fjerning av avviker Lengde på flytende gjennomsnitt. Lederen kan nå forvente bedre kortsiktige prognoser ved å bruke en fem-ukers periode. Operasjonene er imidlertid dynamiske, og det vil være best å vurdere prognosen regelmessig og justere etter behov. Langsiktig: Bruke den normale kurven For manager8217s langsiktige planlegging, for eksempel å forutsi årlig produksjon for neste år, er prognose ved hjelp av normal kurve og Z-score en bedre egnet metode. Fordi lederen ser på sannsynligheter ved bruk av normal kurve, sørger hun først for at fordelingen faktisk er normal. Dette kan gjøres ved hjelp av Anderson-Darling (AD) normality testen. P-verdien (a gt. 10) for pallproduksjonen, justert for å utelukke ferie-ukene, indikerer at fordelingen er omtrent normal. Manager8217s neste skritt er å bruke den statistiske programvaren til å finne sammendragsstatistikk, som vist i figur 3, fordi de inneholder nøkkelprognosekomponenter. Figur 3: Sammendrag for justert produksjon Med dataene samlet her, kan lederen prognose neste år8217s produksjon, forutsatt at det ikke gjøres betydelige endringer. For å begynne, bruker lederen et program for å opprette en sannsynlighetsfordelingsplot, som vist på figur 4. Figur 4: Sannsynlighetsfordelingsplot Denne grafen viser at omtrent 34 prosent av produksjonen vil være mellom de gjennomsnittlige 203 paller og 1 standardavvik (13 paller) mer enn gjennomsnittlig eller 216 paller. Selv om denne prosentandelen kan bli funnet ved hjelp av et program, er manuell beregning nesten like lett. En svart belte kan beregne samme prosentandel ved å bruke Z-poengsummen og referere til et normalt distribusjonsbord. I dette eksemplet, hvor z (antall s en verdi representerer) (216 203) 13 13 13 1. Arealet under kurven representerer 1 (positiv) standardavvik. Et normalt distribusjonsbord viser at en z av 1 .841 8211 .500 .341. eller 34 prosent. For å estimere hvor mange uker ut av året avdelingen kan produsere ved 216 paller eller mer av produkt, eller mer enn 1 standardavvik fra gjennomsnittet, oppdaterer lederen distribusjonsplottet (figur 5). Figur 5: Sannsynlighet for å produsere mer enn 1 Standardavvik fra middel Ved hjelp av grafen ovenfor, anslår lederen at avdelingen kan være på 216 paller eller mer for 16 prosent av året, eller omtrent åtte av de neste 52 ukene. Lederen vil også slå forrige år8217s rekord av produksjon av 231 paller av produkt i en enkelt uke. Derfor setter hun et mål om å nå 235 paller minst en gang. For å finne ut hvor mange ganger ut av de neste 52 ukene kan avdelingen fylle 235 paller, lederen begynner med å beregne Z-poenget: z (235 202) 13 32 13 om 2,46 s Svaret kommer fra å se opp denne Z-poengsummen i normalfordelingstabellen eller ved å produsere en annen distribusjonsgraf i programvaren (figur 6). Figur 6: Sannsynlighet for å produsere mer enn 2,46 Standardavvik fra gjennomsnitt Utsikter for å produsere 235 paller er ikke bra, det er mindre enn 1 prosent sjanse, noe som betyr at det kan skje en gang. Ved å bruke Z-poeng og distribusjonsplott, er lederen imidlertid i stand til å prognose disse resultatene på forhånd og sette rimelige mål. Hvis du elsket denne artikkelen, kan du også elske Legg igjen en kommentar
Comments
Post a Comment