Wednesday, October 19, 2016

Gesentreerde Bewegende Gemiddelde Selfs Tydperk

Wanneer die berekening van 'n lopende bewegende gemiddelde, die plasing van die gemiddelde in die middel tydperk sinvol In die vorige voorbeeld het ons bereken die gemiddeld van die eerste 3 tydperke en sit dit langs tydperk 3. Ons kan die gemiddelde geplaas in die middel van die tyd interval van drie tydperke, dit is, langs tydperk 2. dit werk goed met vreemde tydperke, maar nie so goed vir selfs tydperke. So waar sou ons plaas die eerste bewegende gemiddelde wanneer M 4 Tegnies, sou die bewegende gemiddelde op t 2.5, 3.5 val. Om hierdie probleem wat ons glad Mas using 2. So glad ons die stryk waardes As ons gemiddeld 'n gelyke getal terme te vermy, moet ons die stryk waardes glad Die volgende tabel toon die resultate met behulp van M 4.David, Ja, MapReduce is bedoel is om te werk op 'n groot hoeveelheid data. En die idee is dat in die algemeen, die kaart en die vermindering van funksies shouldn39t sorg hoeveel mappers of hoeveel reducers daar, that39s net optimalisering. As jy mooi oor die algoritme ek gepos dink, kan jy sien dat dit doesn39t aangeleentheid wat Mapper kry wat gedeeltes van die data. Elke insette rekord sal beskikbaar wees om elke verminder operasie wat dit nodig het. â € Joe K 18 September 12 by 22:30 In die beste van my begrip bewegende gemiddelde is nie mooi kaarte te MapReduce paradigma sedert sy berekening in wese is gly venster oor gesorteerde data, terwyl mnr is die verwerking van nie-gesny wissel van gesorteerde data. Oplossing ek sien is soos volg: a) Om te implementeer persoonlike partisioneerder om in staat wees om twee verskillende mure te maak in twee lopies. In elk hardloop jou reducers sal verskillende reekse data te kry en te bereken bewegende gemiddelde waar approprieate Ek sal probeer om te illustreer: In die eerste lopie data vir reducers moet wees: R1: Q1, Q2, Q3, K4 R2: V5, V6, Q7, Q8 . hier sal jy cacluate bewegende gemiddelde vir 'n paar Qs. In volgende lopie moet jou reducers data te kry soos: R1: Q1. V6 R2: V6. Q10 R3: Q10..Q14 En caclulate die res van bewegende gemiddeldes. Dan sal jy nodig het om totaal resultate. Idee van persoonlike partisioneerder dat dit twee modi van die operasie sal moet - elke keer verdeel in gelyke wissel, maar met 'n paar verskuiwing. In 'n pseudokode dit sal lyk. partisie (keySHIFT) / (MAXKEY / numOfPartitions) waar: SHIFT sal geneem word van die opset. MAXKEY maksimum waarde van die sleutel. Ek neem aan vir eenvoud dat hulle begin met 'n nul. RecordReader, IMHO is nie 'n oplossing, want dit is beperk tot spesifieke split en kan nie meer as split grens skuif. Nog 'n oplossing sou wees om te implementeer persoonlike logika van verdeel insette data (dit is deel van die InputFormat). Dit kan gedoen word om 2 verskillende skyfies, soortgelyk aan skeiding te doen. antwoord 17 September 12 aan 8: 59Moving Gemiddeldes en gesentreerde Bewegende Gemiddeldes n paar punte oor seisoenaliteit in 'n tydreeks beer herhaal, selfs al is dit lyk asof hulle voor die hand liggend. Een daarvan is dat die term 8220season8221 nie noodwendig verwys na die vier seisoene van die jaar wat die gevolg is van die kantel van die Earth8217s as. In predictive analytics, 8220season8221 beteken dikwels juis dat, omdat baie van die verskynsels wat ons bestudeer nie wissel saam met die vordering van die lente deur die winter: verkope van die winter of somer rat, insidensie van sekere wydverspreide siektes, weersomstandighede wat veroorsaak word deur die ligging van die jetstream en veranderinge in die temperatuur van die water in die oostelike Stille Oseaan, en so aan. Ewe, kan gebeure wat gereeld voorkom op te tree soos meteorologiese seisoene, selfs al is hulle net 'n vaag verbinding met die seizoenen. Agt-uur skofte in hospitale en fabrieke kry dikwels uitgedruk in die voorkoms van innames en uitgawes van energie daar, 'n seisoen is agt uur lank en die seisoene siklus elke dag, nie elke jaar. Sperdatums vir belasting sein die begin van 'n vloed van dollars in munisipale, staats-en federale skatkamers daar, kan die seisoen een jaar lank (persoonlike inkomstebelasting), ses maande (eiendomsbelasting in baie lande), kwartaallikse (baie korporatiewe belasting ), en so aan. It8217s 'n bietjie vreemd dat ons die woord 8220season8221 algemeen verwys na die gereeld herhalende periode van tyd, maar geen algemene term vir die tydperk waartydens een volle draai van die seisoene kom. 8220Cycle8221 is moontlik, maar in analytics en vooruitskatting daardie kwartaal gewoonlik na 'n tydperk van onbepaalde lengte, beteken soos 'n sakesiklus. In die afwesigheid van 'n beter term, I8217ve gebruik 8220encompassing period8221 in hierdie en daaropvolgende hoofstukke. Dit isn8217t net terminologiese gesug. Die maniere identifiseer ons seisoene en die tydperk waartydens die seisoene draai het ware, indien dikwels klein, implikasies vir hoe ons die gevolge daarvan te meet. Die volgende afdelings bespreek hoe sommige ontleders verskil die manier waarop hulle ook vertroud te bewegende gemiddeldes na gelang van die aantal seisoene is vreemd of selfs. Die gebruik van bewegende gemiddeldes In plaas van Simple Gemiddeldes Veronderstel dat 'n groot stad is die oorweging van die herverdeling van die verkeerspolisie om die voorkoms van bestuur terwyl verswakte, wat die stad is van mening is steeds beter aan te spreek. Vier weke gelede het nuwe wetgewing in werking getree het, die wettiging van die besit en ontspanningsgebruik van dagga. Sedertdien het die daaglikse aantal verkeer arrestasies vir DWI blyk te wees trending op. Kompliserende sake is die feit dat die aantal arrestasies blyk te piek op Vrydae en Saterdae. Plan vir mannekrag vereistes in die toekoms te help, you8217d graag enige onderliggende tendens that8217s tot stand gebring voorspel. You8217d ook graag die ontplooiing van jou hulpbronne tyd om rekening van enige naweek verwant seisoenaliteit neem that8217s plaasvind. Figuur 5.9 het die betrokke inligting wat jy het om te werk met. Figuur 5.9 Met hierdie datastel, elke dag van die week maak 'n seisoen. Selfs deur net eyeballing die grafiek in Figuur 5.9. jy kan sê dat die tendens van die aantal daaglikse arrestasies is tot. You8217ll moet beplan om die aantal verkeersbeamptes uit te brei, en hoop dat die tendens vlakke af gou. Verdere, die data dra uit die idee dat meer arrestasies voorkom gereeld op Vrydae en Saterdae, sodat jou hulpbrontoekenning moet diegene spykers aan te spreek. Maar jy moet die onderliggende tendens kwantifiseer, te bepaal hoeveel bykomende polisie you8217ll moet op te bring. Jy moet ook die verwagte grootte van die naweek spykers kwantifiseer, te bepaal hoeveel bykomende polisie jy hoef te kyk vir wisselvallige bestuurders op daardie dae. Die probleem is dat as van nog jy don8217t weet hoeveel van die daaglikse toename is te danke aan tendens en hoeveel is te danke aan daardie naweek effek. Jy kan begin deur detrending die tydreeks. Vroeër in hierdie hoofstuk, in 8220Simple Seisoene gemiddeldes, 8221 sien jy 'n voorbeeld van hoe om 'n tydreeks detrend om die seisoenale effekte met behulp van die metode van eenvoudige gemiddeldes isoleer. In hierdie afdeling you8217ll sien hoe om dit te doen deur gebruik te maak beweeg averages8212very waarskynlik, is die bewegende-gemiddeldes benadering meer dikwels gebruik word in predictive analytics as die eenvoudige-gemiddeldes benadering. Daar is verskeie redes vir die groter gewildheid van bewegende gemiddeldes, onder hulle, wat op die roering-gemiddeldes benadering jou nie vra om jou data te val in die proses van kwantifisering n tendens. Onthou dat die vorige voorbeeld het dit nodig om kwartaallikse gemiddeldes val om jaarlikse gemiddeldes, bereken 'n jaarlikse tendens, en dan versprei 'n kwart van die jaarlikse tendens oor elke kwartaal van die jaar. Dit stap is nodig om tendens van die seisoenale effekte verwyder. In teenstelling hiermee het die bewegende-gemiddeldes benadering maak dit moontlik om die tydreeks detrend sonder om dié soort van intrige. Figuur 5.10 toon hoe die bewegende-gemiddeldes benadering werk in die huidige voorbeeld. Figuur 5.10 Die bewegende gemiddelde in die tweede grafiek verduidelik die onderliggende tendens. Figuur 5.10 gee 'n bewegende gemiddelde kolom, en 'n kolom vir spesifieke seasonals. om die wat in Figuur 5.9 data. Beide toevoegings vereis 'n bespreking. Die spykers in hegtenis wat plaasvind oor naweke gee jou rede om te glo dat you8217re werk met seisoene wat eens elke week herhaal. Daarom begin deur om die gemiddelde vir die omvattende period8212that is, die eerste sewe seisoene, Maandag tot Sondag. Die formule vir die gemiddelde in sel D5, die eerste beskikbare bewegende gemiddelde, is soos volg: Dit formule gekopieer en geplak af deur sel D29, sodat jy 25 bewegende gemiddeldes gebaseer op 25 lopies van sewe agtereenvolgende dae. Let daarop dat ten einde beide die eerste en die laaste paar waarnemings in die tydreeks te wys, het ek verborge rye 10 deur 17 Jy kan dit sigbaar te maak, as jy wil, in hierdie chapter8217s werkboek, beskikbaar by die publisher8217s webwerf. Maak 'n meervoudige keuse van sigbare rye 9 en 18, regs-kliek op een van hul ry kop, en kies Wys uit die snel menu. As jy 'n worksheet8217s rye weg te steek, as I8217ve gedoen in figuur 5.10. enige Geoktrooieerde data in die verborge rye is ook weggesteek op die grafiek. Die x-as etikette identifiseer net die datapunte wat op die grafiek verskyn. Omdat elke bewegende gemiddelde in Figuur 5.10 sluit sewe dae, is geen bewegende gemiddelde saam met die eerste drie of laaste drie werklike waarnemings. Kopieer en plak die formule in sel D5 op 'n dag tot sel D4 loop jy uit observations8212there is geen waarneming opgeneem in sel C1. Net so, is daar geen bewegende gemiddelde hieronder sel D29 aangeteken. Kopieer en plak die formule in D29 in D30 sou 'n waarneming in sel C33 vereis, en geen waarneming is beskikbaar vir die dag wat sel sou verteenwoordig. Dit sou moontlik wees, natuurlik, om die lengte van die bewegende gemiddelde verkort om, sê, vyf in plaas van sewe. Deur dit te doen sal beteken dat die bewegende gemiddelde formules in figuur 5.10 kan begin in sel D4 in plaas van D5. Maar in hierdie soort ontleding, jy wil die lengte van die bewegende gemiddelde van die aantal seisoene gelyk: sewe dae in 'n week vir gebeure wat weekliks herhaal impliseer 'n bewegende gemiddelde lengte sewe en vier kwartale in 'n jaar vir die gebeure wat jaarliks ​​herhaal impliseer 'n bewegende gemiddelde lengte vier. Saam soortgelyke lyne, ons oor die algemeen seisoenale effekte op so 'n manier dat hulle totaal nul binne die omvattende tydperk kwantifiseer. As jy in hierdie chapter8217s eerste artikel gesien het, op eenvoudige gemiddeldes, dit word gedoen deur die berekening van die gemiddelde van (sê) die vier kwartale in 'n jaar, en dan trek die gemiddelde vir die jaar uit elke kwartaallikse figuur. Sodoende verseker dat die totale van die seisoenale effekte is nul. Op sy beurt het that8217s nuttig omdat dit sit die seisoenale effekte op 'n gemeenskaplike footing8212a somer effek van 11 is so ver van die gemiddelde as 'n winter effek van 821111. As jy wil vyf seisoene in plaas van sewe gemiddeld tot jou bewegende gemiddelde te kry, you8217re beter af om 'n verskynsel wat elke vyf seisoene in plaas van sewe herhaal. Maar wanneer jy die gemiddeld van die seisoenale effekte later in die proses te neem, die gemiddeldes is onwaarskynlik dat som aan nul. It8217s nodig op daardie stadium te lyn met sy wil, of te normaliseer. die gemiddeldes sodat hulle som is nul. Wanneer that8217s gedoen, die gemiddelde seisoenale gemiddeldes druk die effek op 'n tydperk van behoort aan 'n bepaalde seisoen. Sodra genormaliseer, is die seisoenale gemiddeldes genoem die seisoenale indekse wat hierdie hoofstuk reeds 'n paar keer genoem. You8217ll sien hoe dit werk later in hierdie hoofstuk, in 8220Detrending die reeks met bewegende Averages.8221 Verstaan ​​Spesifieke Seasonals Figuur 5.10 toon ook wat is spesifieke seasonals in kolom E. genoem Hulle is what8217s links na aftrekking van die bewegende gemiddelde van die werklike waarneming. Om 'n gevoel van wat die spesifieke seasonals verteenwoordig te kry, kyk na die bewegende gemiddelde in sel D5. Dit is die gemiddeld van die waarnemings in C2: C8. Die afwykings van elke waarneming van die bewegende gemiddelde (byvoorbeeld, C2 8211 D5) is gewaarborg om op te som 'n kenmerk van 'n gemiddelde zero8212that8217s. Dus, elke afwyking gee uitdrukking aan die effek van wat verband hou met daardie spesifieke dag in daardie spesifieke week. It8217s n spesifieke seisoen, then8212specific omdat die afwyking van toepassing op daardie spesifieke Maandag of Dinsdag en so aan, en seisoenale want in hierdie voorbeeld we8217re elke dag behandel asof dit 'n tyd lank in die omvattende tydperk van 'n week. Omdat elke spesifieke seisoenale maatreëls die effek van wat in daardie tyd ten 224-vis die bewegende gemiddelde vir daardie groep (hier) sewe seisoene, kan jy daarna Gemiddeld spesifieke seasonals vir 'n bepaalde seisoen (byvoorbeeld, al die Vrydae in jou tydreekse) om te skat wat season8217s algemeen, eerder as spesifieke, effek. Dit gemiddelde word nie beskaamd deur 'n onderliggende tendens in die tydreeks, want elke spesifieke seisoenale uitdrukking aan 'n afwyking van sy eie besondere bewegende gemiddelde. Aanpassing van die Moving Gemiddeldes There8217s ook die kwessie van die aanpassing van die bewegende gemiddeldes met die oorspronklike datastel. In Figuur 5.10. Ek het elke bewegende gemiddelde lyn met die middelpunt van die reeks waarnemings wat dit insluit. So, byvoorbeeld, die formule sel D5 gemiddeldes in die waarnemings in C2: C8, en ek het dit in lyn met die vierde waarneming, die middelpunt van die gemiddeld reeks, deur dit in ry 5. Hierdie reëling is die sogenaamde 'n gesentreerde bewegende gemiddelde . en baie ontleders verkies om elke bewegende gemiddelde in lyn met die middelpunt van die waarnemings wat dit gemiddeldes. Hou in gedagte dat in hierdie konteks, 8220midpoint8221 verwys na die middel van 'n tydsduur: Donderdag is die middelpunt van Maandag tot Sondag. Dit verwys nie na die mediaan van die waargeneem waardes, hoewel natuurlik is dit dalk so uitgewerk nie in die praktyk. 'N Ander benadering is die sleep bewegende gemiddelde. In daardie geval, is elke bewegende gemiddelde lyn met die laaste opmerking dat dit averages8212and daarom roetes agter sy argumente. Dit is dikwels die voorkeur reëling as jy wil 'n bewegende gemiddelde gebruik as 'n voorspelling, soos gedoen word met eksponensiële gladstryking, omdat jou finale bewegende gemiddelde voorkom samevallende met die finale beskikbaar waarneming. Gesentreer Bewegende Gemiddeldes met ewe getalle van seisoene Ons gewoonlik neem 'n spesiale prosedure wanneer die aantal seisoene is selfs eerder as vreemd. That8217s die tipiese toedrag van sake: Daar is geneig om ewe getalle van seisoene in die omvattende tydperk vir 'n tipiese seisoene wees soos maande, kwartale, en vier jaarlikse periodes (vir verkiesings). Die probleem met 'n ewe aantal seisoene is dat daar geen middelpunt. Twee is nie die middelpunt van 'n reeks begin by 1 en eindig op 4, en nie is 3 of dit kan gesê word om een ​​te hê, sy middelpunt is 2.5. Ses is nie die middelpunt van 1 tot 12, en nie is 7 sy suiwer teoretiese middelpunt is 6.5. Om op te tree asof 'n middelpunt bestaan, moet jy 'n laag van gemiddeld bo die bewegende gemiddeldes te voeg. Sien Figuur 5.11. Figuur 5.11 Excel bied verskeie maniere om 'n gesentreerde bewegende gemiddelde te bereken. Die idee agter hierdie benadering tot om 'n bewegende gemiddelde that8217s gesentreer op 'n bestaande middelpunt toe there8217s 'n gelyke getal seisoene, is om daardie middelpunt vorentoe trek deur 'n halwe seisoen. Jy kan bereken 'n bewegende gemiddelde wat by, sê, die derde punt sou wees gesentreer in die tyd as vyf seisoene in plaas van vier saamgestel een volle draai van die kalender. That8217s gedoen deur twee agtereenvolgende bewegende gemiddeldes en hulle gemiddeld. So in Figuur 5.11. there8217s n bewegende gemiddelde in sel E6 dat gemiddeldes die waardes in D3: D9. Omdat daar vier seisoenale waardes in D3: D9, is die bewegende gemiddelde in E6 beskou as gesentreer op die denkbeeldige seisoen 2.5, 'n halwe punt kort van die eerste beskikbare kandidaat seisoen, 3. (Seisoene 1 en 2 is nie beskikbaar as middelpunte vir 'n gebrek aan data om gemiddeld voor Seisoen 1.) Let egter dat die bewegende gemiddelde sel E8 gemiddeldes in die waardes in D5: D11, die tweede deur die vyfde plek in die tydreeks. Dat die gemiddelde is gesentreer op (denkbeeldige) wys 3.5, 'n volle tydperk wat voorlê van die gemiddelde gesentreer op 2.5. Deur die gemiddeld van die twee bewegende gemiddeldes, sodat die denke gaan, kan jy die middelpunt van die eerste bewegende gemiddelde vorentoe trek met 'n halwe punt van 2,5 tot 3 That8217s wat die gemiddeldes in kolom F van figuur 5.11 doen. Cell F7 bied die gemiddelde van die bewegende gemiddeldes in E6 en E8. En die gemiddelde in F7 is in lyn met die derde data punt in die oorspronklike tydreekse, in sel D7, om te beklemtoon dat die gemiddelde is gesentreer op daardie seisoen. As jy die formule in sel F7 asook die bewegende gemiddeldes in selle E6 en E8 brei, you8217ll sien dat dit blyk om 'n geweegde gemiddelde van die eerste vyf waardes in die tyd reeks wees, met die eerste en vyfde waarde gegee word 'n gewig van 1, en die tweede deur vierde waardes gegewe 'n gewig van 2. Dit lei ons na 'n vinniger en makliker manier om 'n gesentreerde bewegende gemiddelde bereken met 'n ewe aantal seisoene. Nog in Figuur 5.11. die gewigte word gestoor in die reeks H3: H11. Hierdie formule gee die eerste gesentreerde bewegende gemiddelde, in sel I7: Dit formule terug 13,75. wat identies is aan die waarde bereken deur die dubbel-gemiddelde formule in sel F7. Die maak van die verwysing na die gewigte absolute, deur middel van die dollar tekens in H3: H11. jy kan die formule kopieer en plak dit af so ver as wat nodig is om die res van die gesentreerde bewegende gemiddeldes te kry. Detrending die reeks met bewegende gemiddeldes Wanneer jy die bewegende gemiddeldes van die oorspronklike waarnemings afgetrek om die spesifieke seasonals kry, het jy die onderliggende tendens van die reeks verwyder. What8217s links in die spesifieke seasonals is gewoonlik 'n stilstaande, horisontale reeks met twee effekte wat veroorsaak dat die spesifieke seasonals af te wyk van 'n absoluut reguit lyn: die seisoenale effekte en ewekansige fout in die oorspronklike waarnemings. Figuur 5.12 toon die resultate vir hierdie voorbeeld. Figuur 5.12 Die spesifieke seisoenale effekte vir Vrydag en Saterdag bly duidelik in die detrended reeks. Die boonste grafiek in Figuur 5.12 toon die oorspronklike daaglikse waarnemings. Beide die algemene opwaartse neiging en die naweek seisoenale spykers is duidelik. Die onderste grafiek toon die spesifieke seasonals: die resultaat van detrending die oorspronklike reeks met 'n bewegende gemiddelde filter, soos beskryf vroeër in 8220Understanding Spesifieke Seasonals.8221 Jy kan sien dat die detrended reeks is nou feitlik horisontale ( 'n lineêre tendenslyn vir die spesifieke seasonals het 'n effense afwaartse drif), maar die seisoenale Vrydag en Saterdag spykers is steeds in plek. Die volgende stap is om te beweeg na die spesifieke seasonals om die seisoenale indekse. Sien Figuur 5.13. Figuur 5.13 Die spesifieke seasonals effekte eerste gemiddeld en dan genormaliseer tot die seisoenale indekse bereik. In Figuur 5.13. die spesifieke seasonals in kolom E herrangskik in die tabel getoon in die reeks H4: N7. Die doel is eenvoudig om te maak dit makliker om die seisoenale gemiddeldes te bereken. Diegene gemiddeldes word in H11: N11. Maar die figure in H11: N11 is gemiddeldes, nie afwykings van 'n gemiddelde, en dus can8217t ons verwag dat hulle som aan nul. Ons moet nog aan te pas sodat hulle afwykings van 'n groot gemiddelde uit te druk. Dit Grand gemiddelde verskyn in sel N13, en is die gemiddelde van die seisoenale gemiddeldes. Ons kan kom by die seisoenale indekse deur af te trek die Grand gemiddelde in N13 uit elk van die seisoenale gemiddeldes. Die gevolg is in die reeks H17: N17. Hierdie seisoenale indekse is nie meer spesifiek vir 'n bepaalde bewegende gemiddelde, soos in die geval met die spesifieke seasonals in kolom E. Omdat they8217re gebaseer op 'n gemiddeld van elke geval van 'n gegewe tyd, hulle druk die gemiddelde effek van 'n gegewe tyd oor die vier weke in die tyd reeks. Verder is hulle maatstawwe van 'n season8217s8212here, 'n day8217s8212effect op verkeer arrestasies ten 224-vis die gemiddelde vir 'n tydperk van sewe dae. Ons kan nou gebruik die seisoenale indekse om die reeks deseasonalize. We8217ll gebruik die seisoen gezuiverde reeks om voorspellings te kry deur middel van lineêre regressie of Holt8217s metode van glad tendens reeks (bespreek in Hoofstuk 4). Dan voeg ons net die seisoenale indekse terug in die voorspellings vir hulle reseasonalize. Dit alles lyk in Figuur 5.14. Figuur 5.14 Nadat jy die seisoenale indekse, die afrondingswerk soos hier toegepas is dieselfde as in die metode van eenvoudige gemiddeldes. Die stappe in figuur 5.14 is grootliks dieselfde as dié in figure 5.6 en 5.7. bespreek in die volgende afdelings. Deseasonalizing die waarnemings Trek die seisoenale indekse van die oorspronklike waarnemings die data deseasonalize. Jy kan dit doen soos getoon in Figuur 5.14. waarin die oorspronklike waarnemings en die seisoenale indekse gerangskik as twee lyste begin in dieselfde ry, kolom C en F. Hierdie reëling maak dit 'n bietjie makliker om die berekeninge te struktureer. Jy kan ook die aftrek soos getoon in Figuur 5.6. waarin die oorspronklike kwartaallikse waarnemings (C12: F16), die kwartaallikse indekse (C8: F8), en die seisoen gezuiverde resultate (C20: F24) word in 'n tabelvorm. Dit reëling maak dit 'n bietjie makliker om te fokus op die seisoenale indekse en die deseasoned kwartaallikse publikasies. Voorspelling van die seisoen gezuiverde waarnemings in Figuur 5.14. die seisoen gezuiverde waarnemings is in kolom H, en in figuur 5.7 they8217re in kolom C. Ongeag of jy wil 'n regressie benadering of 'n glad benadering tot die voorspelling gebruik, it8217s bes om die seisoen gezuiverde waarnemings in 'n lys enkel-kolom te reël. In Figuur 5.14. die voorspellings in kolom J. Die volgende skikkingsformule is in die reeks J2 aangegaan: J32. Vroeër in hierdie hoofstuk, het ek daarop gewys dat as jy die x-waardes argument laat uit die TREND () function8217s argumente, Excel verskaf die standaard waardes 1. 2. N. waar n die aantal y-waardes. In die formule net gegee, H2: H32 bevat 31 y-waardes. Omdat die argument gewoonlik met die x-waardes ontbreek, Excel verskaf die standaard waardes 1. 2. 31. Dit is die waardes wat ons wil in elk geval gebruik, in kolom B, sodat die formule soos gegee is gelykstaande aan TREND (H2: H32, B2: B32). En that8217s die struktuur wat in D5: D24 van figuur 5.7: Om die Een-stap-Ahead Voorspelling Tot dusver het jy gereël vir voorspellings van die seisoen gezuiverde tydreekse van t 1 deur middel van t 31 in Figuur 5.14. en uit t 1 deur middel van t 20 in Figuur 5.7. Hierdie voorspellings uitmaak nuttige inligting vir verskeie doeleindes, insluitende die beoordeling van die akkuraatheid van die voorspellings deur middel van 'n RMSE ontleding. Maar jou hoofdoel is voorspel ten minste die volgende, soos nog waargeneem tydperk. Om dit te kry, kan jy die eerste keer voorspel van die TREND () of LINEST () funksie as you8217re behulp regressie, of van die eksponensiële gladstryking formule as you8217re behulp Holt8217s metode. Dan kan jy die gepaardgaande seisoenale indeks voeg tot die agteruitgang of glad voorspelling, om 'n voorspelling dat beide die tendens en die seisoenale effek sluit kry. In Figuur 5.14. jy die regressie voorspel in sel J33 met hierdie formule: In hierdie formule, die y-waardes in H2: H32 is dieselfde as in die ander TREND () formules in kolom J. So is die (standaard) x-waardes van 1 deur 32. Nou, al is, verskaf jy 'n nuwe x-waarde as die function8217s derde argument, wat jy TREND () vertel om te kyk in sel B33. It8217s 32. die volgende waarde van t. En Excel gee terug Die waarde 156,3 in sel J33. Die funksie TREND () in sel J33 vertel Excel, in werking tree, 8220Calculate die regressievergelyking vir die waardes in H2: H32 agteruitgang op die t-waardes 1 tot 31. Pas dit regressievergelyking om die nuwe x-waarde van 32 en die standaard van die result.8221 You8217ll dieselfde benadering geneem in sel D25 van figuur 5.7 vind. waar die formule om die een-stap-ahead voorspelling te kry, is dit: Voeg die seisoenale indekse weer in die finale stap is om die voorspellings reseasonalize deur die byvoeging van die seisoenale indekse om die tendens voorspellings, omkeer wat jy gedoen het vier stappe terug wanneer jy afgetrek die indekse van die oorspronklike waarnemings. Dit word gedoen in kolom F in Figuur 5.7 en kolom K in Figuur 5.14. Don8217t vergeet om die toepaslike seisoenale indeks vir die een-stap-ahead voorspelling voeg, met die bedrag wat in sel F25 in Figuur 5.7 en in sel K33 in Figuur 5.14 resultate. (I8217ve skadu die een-stap-ahead selle in beide figuur 5.7 en figuur 5.14 om die voorspellings na vore te bring.) Jy kan kaarte van drie vertoë van die verkeer in hegtenis data vind in Figuur 5.15. die seisoen gezuiverde reeks, die lineêre voorspelling van die seisoen gezuiverde data, en die reseasonalized voorspellings. Let daarop dat die voorspellings inkorporeer beide die algemene tendens van die oorspronklike data en sy Vrydag / Saterdag spykers. Figuur 5.15 kartering van die forecasts.6.2 bewegende gemiddeldes ma 40 elecsales, sodat 5 41 In die tweede kolom van die tabel, is 'n bewegende gemiddelde van orde 5 getoon, die verskaffing van 'n skatting van die tendens-siklus. Die eerste waarde in hierdie kolom is die gemiddeld van die eerste vyf Waarnemings (1989-1993) die tweede waarde in die 5-MA kolom is die gemiddeld van die waardes 1990-1994 en so aan. Elke waarde in die 5-MA kolom is die gemiddeld van die waarnemings in die tydperk van vyf jaar gesentreer op die ooreenstemmende jaar. Daar is geen waardes vir die eerste twee jaar of laaste twee jaar, want ons hoef nie twee waarnemings aan weerskante. In die formule hierbo, kolom 5-MA bevat die waardes van hoed met K2. Om te sien wat die tendens-siklus skatting lyk, stip ons dit saam met die oorspronklike data in figuur 6.7. plot 40 elecsales, hoof quotResidential elektrisiteit salesquot, ylab quotGWhquot. XLab quotYearquot 41 lyne 40 MA 40 elecsales, 5 41. Kol quotredquot 41 Let op hoe die tendens (in rooi) is gladder as die oorspronklike data en vang die grootste beweging van die tydreeks sonder al die geringe fluktuasies. Die bewegende gemiddelde metode nie skattings van T toelaat waar t is baie naby aan die einde van die reeks vandaar die rooi lyn nie uit te brei na die kante van die grafiek aan weerskante. Later sal ons meer gesofistikeerde metodes van die tendens-siklus skatting wat doen toelaat skattings naby die eindpunte gebruik. Die einde van die bewegende gemiddelde bepaal die gladheid van die tendens-siklus skatting. In die algemeen, 'n groter orde beteken 'n gladder kurwe. Die volgende grafiek toon die effek van die verandering van die orde van die bewegende gemiddelde vir die residensiële verkope elektrisiteit data. Eenvoudige bewegende gemiddeldes soos hierdie is gewoonlik van vreemde orde (bv 3, 5, 7, ens) Dit is sodat hulle is simmetries: in 'n bewegende gemiddelde van orde m2k1, daar is k vroeër waarnemings, k later waarnemings en die Midde-waarneming wat gemiddeld. Maar as m selfs was, sou dit nie meer simmetriese wees. Bewegende gemiddeldes van bewegende gemiddeldes Dit is moontlik om 'n bewegende gemiddelde van toepassing op 'n bewegende gemiddelde. Een van die redes hiervoor is om 'n nog-orde bewegende gemiddelde simmetriese maak. Byvoorbeeld, kan ons 'n bewegende gemiddelde van orde 4 neem, en dan nog 'n bewegende gemiddelde van orde 2 van toepassing is op die resultate. In Tabel 6.2, is dit gedoen en vir die eerste paar jaar van die Australiese kwartaallikse bier produksie data. BEER2 LT venster 40 ausbeer, begin 1992 41 ma4 LT ma 40 BEER2, sodat 4. sentrum ONWAAR 41 ma2x4 LT ma 40 BEER2, sodat 4. sentrum WAAR 41 Die notasie 2times4-MA in die laaste kolom beteken 'n 4-MA gevolg deur 'n 2-MA. Die waardes in die laaste kolom word verkry deur die neem van 'n bewegende gemiddelde van orde 2 van die waardes in die vorige kolom. Byvoorbeeld, die eerste twee waardes in die 4-MA kolom is 451,2 (443.410.420.532) / 4 en 448,8 (410.420.532.433) / 4. Die eerste waarde in die 2times4-MA kolom is die gemiddeld van die twee: 450,0 (451.2448.8) / 2. Wanneer 'n 2-MA volg op 'n bewegende gemiddelde van al orde (soos 4), is dit bekend as 'n gesentreerde bewegende gemiddelde van orde 4. Dit is omdat die resultate is nou simmetriese. Om te sien dat dit die geval is, kan ons die 2times4-MA soos volg skryf: begin hoed amp frac Bigfrac (J J J J) frac (J J J J) Big amp frac y frac14y frac14y frac14y frac18y. Uiteindelik gaan dit nou 'n geweegde gemiddelde van waarnemings, maar dit is simmetriese. Ander kombinasies van bewegende gemiddeldes is ook moontlik. Byvoorbeeld 'n 3times3-MA word dikwels gebruik, en bestaan ​​uit 'n bewegende gemiddelde van orde 3 gevolg deur 'n ander bewegende gemiddelde van orde 3. In die algemeen, moet 'n gelyke orde MA word gevolg deur 'n nog bevel MA dit simmetriese maak. Net so moet 'n vreemde orde MA word gevolg deur 'n vreemde orde MA. Skatte van die tendens-siklus met seisoenale data Die mees algemene gebruik van gesentreer bewegende gemiddeldes is in die beraming van die tendens-siklus van seisoenale data. Oorweeg die 2times4-MA: hoed frac y frac14y frac14y frac14y frac18y. Wanneer dit toegepas word om kwartaalliks data, word elke kwartaal van die jaar gegee gelyke gewig as die eerste en laaste terme van toepassing op dieselfde kwartaal in agtereenvolgende jare. Gevolglik sal die seisoenale variasie word gemiddeld uit en die gevolglike waardes van hoed t sal min of oorblywende geen seisoenale variasie het. 'N soortgelyke effek sal verkry word met behulp van 'n 2times 8-MA of 'n 2times 12-MA. In die algemeen, 'n 2times m-MA is gelykstaande aan 'n geweegde bewegende gemiddelde van orde M1 met alle waarnemings wat gewig 1 / m, behalwe vir die eerste en laaste terme wat gewigte neem 1 / (2 miljoen). So as die seisoenale tydperk is selfs en orde m, gebruik 'n 2times m-MA aan die tendens-siklus te skat. As die seisoenale tydperk is vreemd en orde m, gebruik 'n m-MA aan die tendens siklus skat. In die besonder, kan 'n 2times 12-MA gebruik word om die tendens-siklus van maandelikse data te skat en 'n 7-MA gebruik kan word om die tendens-siklus van die daaglikse data te skat. Ander keuses vir die einde van die MA sal gewoonlik lei tot tendens-siklus skattings besmet deur die seisoenaliteit in die data. Voorbeeld 6.2 Elektriese toerusting vervaardiging Figuur 6.9 toon 'n 2times12-MA toegepas op die elektriese toerusting bestellings indeks. Let daarop dat die gladde lyn toon geen seisoenaliteit dit is byna dieselfde as die tendens-siklus word in Figuur 6.2 wat na raming met behulp van 'n veel meer gesofistikeerde metode as bewegende gemiddeldes. Enige ander keuse vir die einde van die bewegende gemiddelde (behalwe vir 24, 36, ens) sou gelei tot 'n gladde lyn wat 'n paar seisoenale skommelinge toon. plot 40 elecequip, ylab quotNew bestellings indexquot. Kol quotgrayquot, hoof quotElectrical toerusting vervaardiging (Eurogebied) quot 41 lyne 40 MA 40 elecequip, sodat 12 41. Kol quotredquot 41 Geweegde bewegende gemiddeldes Kombinasies van bewegende gemiddeldes lei tot geweegde bewegende gemiddeldes. Byvoorbeeld, die 2x4-MA hierbo bespreek is gelykstaande aan 'n geweegde 5-MA met gewigte deur frac, frac, frac, frac, frac. In die algemeen kan 'n geweegde m-MA geskryf word as hoed t som k AJ y, waar k (m-1) / 2 en die gewigte word deur 'n, kolle, AK. Dit is belangrik dat die gewigte al som tot een en dat hulle simmetriese sodat 'n aj. Die eenvoudige m-MA is 'n spesiale geval waar al die gewigte is gelyk aan 1 / m. 'N Groot voordeel van geweegde bewegende gemiddeldes is dat hulle toegee n gladder skatting van die tendens-siklus. In plaas van waarnemings betree en verlaat die berekening op volle gewig, is hul gewigte stadig toegeneem en dan stadig afgeneem wat lei tot 'n gladder kurwe. Sommige spesifieke stelle gewigte is wyd gebruik word. Sommige van hierdie word in Tabel 6.3.is 'n verklaring van die toekoms. is 'n basis vir die beplanning, is nie net vir vooruitskatting vraag, vereis 'n ervare vermenging van kuns en wetenskap, veronderstel dat die onderliggende stelsel sal voortgaan om te bestaan ​​in die toekoms, en is selde volmaak. Voorspellings vir groepe van items is geneig om meer akkuraat as voorspellings vir individuele items te wees, want vooruitskatting foute onder items in 'n groep het gewoonlik 'n kansellasie van krag. Voorspelling akkuraatheid afneem as die tydperk gedek deur die voorspelling toeneem. Elemente van 'n goeie vooruitsig: Die voorspelling horison moet die tyd wat nodig is bedek met moontlike veranderinge te implementeer. Die mate van akkuraatheid moet vermeld word. Die voorspelling moet betroubaar dit moet konsekwent te werk. Die voorspelling moet uitgedruk word in betekenisvolle eenhede. Die voorspelling moet op skrif wees. Die voorspelling moet eenvoudig om te verstaan ​​en te gebruik, of in ooreenstemming met historiese data intuïtief. Bepaal die doel van die skatting. Wat is die doel daarvan en wanneer sal dit nodig wees Vestig 'n tydhorison. Kies 'n vooruitskatting tegniek. Versamel en te ontleed. Berei skatting. Monitor die skatting. Uitvoerende menings, meestal vir 'n lang-afstand beplanning en bekendstelling van nuwe produkte. Die uitsig van een persoon kan seëvier. Direkte kliënt kontak samestellings. Nie in staat om te onderskei tussen wat kliënte wil doen en wat hulle eintlik sal doen. Kan té beïnvloed deur die onlangse verkope ervarings. Lae verkope kan lei tot 'n lae beramings. Konflik van belange. Lae verkope skattings lei tot beter verkope prestasie. Verbruikers opname of punt-van-verkope (POS) data. Duur en tydrowend. Moontlike bestaan ​​van irrasionele patrone. Lae reaksie pryse. Menings van bestuurders en personeel. Delphi-metode (Rand Corporation 1948): Bestuurders en personeel volledige 'n reeks van vraelyste, elke ontwikkel uit die vorige een, 'n konsensusvoorspelling bereik. Oslash Tegnologiese vooruitskatting. Oslash Langtermyn enkele-time voorspelling. Oslash Data is duur om te bekom. 2.1.2 Statistiese (Time Series) Voorspelling s Dit is uiters belangrik om data te stip en ondersoek hulle voor om enige analise of skatting. 'N vraag voorspelling moet gebaseer wees op 'n tyd reeks afgelope vraag eerder as verkope of gestuur. Tendens: 'n lang termyn opwaartse of afwaartse beweging in data. Seisoenaliteit: Korttermyn gereelde variasies met betrekking tot die weer, vakansie, of ander faktore. Siklus: Golfagtige variasie wat langer as 'n jaar. Onreëlmatige Variasie: Veroorsaak deur buitengewone omstandighede, nie 'n weerspieëling van tipiese gedrag. Ewekansige variasie: Residuele variasie nadat alle ander gedrag is verantwoordelik vir. Naïef Voorspelling Die voorspelling vir 'n tydperk gelyk aan die vorige period8217s werklike waarde. voorspel ten tye. en werklike data op tyd. middot Vinnige en maklik om voor te berei. middot Maklik om te verstaan. middot Kan aangewend word om data met seisoenaliteit en tendens. voorspel ten tye, tydsverloop, werklike data op tyd, seisoen / tendens afhanklik konstante, en 'n seisoen / tendens tyd been. Die verhoogde akkuraatheid van ander metodes moet die bykomende hulpbron wat nodig is om daardie akkuraatheid te bereik regverdig. (Geweegde) bewegende gemiddelde Moving gemiddelde gebruik van 'n aantal van die mees onlangse werklike datawaardes in die opwekking van 'n skatting. verwys na die mees onlangse tydperk, aantal periodes (datapunte) in die bewegende gemiddelde, werklike waarde met die ouderdom. gewig van. en bewegende gemiddelde van die mees onlangse werklike voorspellings. middot Maklik om te bereken en te verstaan. middot Moving gemiddelde voorspelling loop en alles dra by die werklike vooruitsig. middot Die aantal datapunte in die gemiddelde bepaal sy sensitiwiteit vir elke nuwe data punt: hoe minder die datapunte in 'n gemiddelde, hoe meer ontvanklik die gemiddelde is geneig om te wees. middot Gewigte kan tot waardes bygevoeg in die gemiddelde tot die gevolglike gemiddeld meer reageer op 'n onlangse data punte te maak. Maar gewigte behels die gebruik van probeer-en-tref om geskikte gewigte vind. Eksponensiële Smoothing eksponensiële gladstryking is 'n geweegde gemiddelde metode wat gebaseer is op vorige skatting plus 'n persentasie van sy voorspelling fout. Voorspelling vir tydperk, voorspel vir tydperk, glad konstante,. en werklike vraag of verkope vir tydperk. Wat algemeen gebruik word waardes van reeks 0,05-0,50. Lae waardes van word gebruik wanneer die onderliggende gemiddelde is geneig om te wees stabiele hoër waardes word gebruik wanneer die onderliggende gemiddelde is vatbaar vir verandering. Bewegende gemiddelde of naïef voorspelling gebruik kan word om die aanvang Voorspelling vir eksponensiële gladstryking genereer. 'N Eenvoudige plot van data kan dikwels openbaar die bestaan ​​en aard van 'n tendens. Lineêre tendense is redelik algemeen en die maklikste om te werk met. Lineêre Trend gespesifiseerde aantal tydperke van, voorspel vir tydperk, waarde van. en helling van die lyn. Die gebruik van historiese data, kan beide koëffisiënte bereken as aantal periodes, en waarde van tyd. - Tendens Aangepas Eksponensiële Smoothing (Double Smoothing) glad voorspelling, huidige tendens skat, waar en is glad konstantes, en. Seisoenaliteit is gereelde beweging in 'n reeks waardes wat kan gekoppel word aan herhalende gebeure. Dit is ook van toepassing op die daaglikse, weeklikse, maandelikse, en ander gereelde herhalende patrone in data. As 'n data-reeks is geneig om wissel rondom 'n gemiddelde waarde, is die seisoen in terme van wat die gemiddelde as tendens is teenwoordig, seisoenaliteit word uitgedruk in terme van die tendens waarde. Daar is twee modelle van seisoenaliteit: optellings - en vermenigvuldigingsomgekeerdes. In die praktyk, besighede gebruik die multiplikatiewe model baie meer gereeld as die toevoeging model. Die eenvoudigste seisoenale model is 'n variasie van die naiumlve tegniek beskryf vir gemiddeldes. In vermenigvuldigende model, is die seisoenale persentasies verwys as seisoenale familie of seisoenale indekse. Seisoenale familie word in deseasonalizing data of inkorporeer seisoenaliteit in 'n skatting. Deseasonalizing data is tot stand gebring word deur elke datapunt deur sy ooreenstemmende seisoenale familielid. Inkorporeer seisoenaliteit bereik kan word op die volgende manier: 1. Kry tendens skat vir gewenste tydperke met behulp van 'n tendens vergelyking. 2. seisoenaliteit by die tendens skattings deur hierdie tendens skattings te vermenigvuldig met die ooreenstemmende seisoenale familie. 'N algemeen gebruikte metode vir die berekening van seisoenale familie behels die berekening van 'n gesentreerde bewegende gemiddelde. Byvoorbeeld, veronderstel die volgende tydreeksdata: Die 3-tydperk gemiddeld 42,67. As 'n gesentreerde gemiddelde, is dit geplaas in tydperk 2. Die verhouding van die vraag by tydperk 2 tot hierdie gesentreer gemiddelde is 'n skatting van die seisoen familielid by tydperk 2. Omdat die verhouding is 46 / 42.671.08, die reeks is sowat 8 bogemiddelde op daardie stadium. Dit is gewoonlik nodig om seisoenale verhoudings te bereken vir 'n aantal seisoene en gemiddeld hulle 'n redelike skatting van seisoenaliteit vir enige seisoen te behaal. Byvoorbeeld, die beraamde Vrydag familielid van die volgende tabel is (1.36 1.40 1.33) / 3 1.36. Wanneer die aantal periodes vir die berekening van die gesentreerde bewegende gemiddelde is selfs, word een addisionele stap wat nodig is, omdat die middel van 'n selfs 'val tussen twee tydperke. Die bykomende stap vereis die neem van 'n gesentreerde 2-tydperk bewegende gemiddelde van die ewe gesentreerde bewegende gemiddelde (sien probleem 5 van Hoofstuk 3). Siklusse is op en af ​​beweging soortgelyk aan seisoenale variasies, maar van 'n langer duur, bv 05:58 jaar tussen pieke. Dit is moeilik om siklusse van die verlede data te projekteer, want draaipunte is moeilik om te identifiseer. 'N Kort bewegende gemiddelde of 'n naïewe benadering kan van 'n paar waarde wees. Hoë korrelasie van 'n voorspelling met vooraanstaande veranderlikes kan nuttig wees in die berekening van die voorspelling wees. Eenvoudige lineêre regressie Die eenvoudige lineêre regressie bied 'n lineêre vergelyking van twee veranderlikes, wat die som van 'n vierkant vertikale afleidings datapunte vanaf die lyn verminder. Die vergelyking word voorspel / afhanklike veranderlike, voorspeller / onafhanklike veranderlike, helling van die lyn, en waarde van. wanneer . Die koëffisiënte en van die lyn word bereken deur die volgende twee vergelykings: aantal gepaarde waarnemings. Die regressielyn is die beste om gebruik te word vir die reeks waargeneem waardes. Korrelasie meet die sterkte en rigting van die verhouding tussen twee veranderlikes. Korrelasie kan wissel 82.111,00-1,00. middot n korrelasie van 1.00 dui daarop dat veranderinge in een veranderlike altyd gepaard gaan met toenames in die ander middot n korrelasie van 82111,00 dui daarop dat stygings in een veranderlike is pas deur dalings in die ander middot n korrelasie naby aan nul dui bietjie lineêre verwantskap tussen twee veranderlikes . Die korrelasie van twee veranderlikes kan bereken word deur die volgende vergelyking die vierkant van die korrelasiekoëffisiënt,. bied 'n maatstaf van hoe goed 'n regressielyn 8220fits8221 die data. Die waardes van reeks 0-1,00. Hoe nader is om 1.00, hoe beter is die pas.


No comments:

Post a Comment