Thursday, October 6, 2016

5 punt eenvoudige simmetriese bewegende gemiddelde

Bewegende gemiddeldes faseverskuiwing is die verskil in die opsporing van draaipunte tussen oorspronklike en stryk data. Hierdie effek is 'n nadeel as dit veroorsaak 'n vertraging in die opsporing van die draaipunte van die tydreeks, veral in die mees onlangse tydperk. Die simmetriese, gesentreer bewegende gemiddeldes is bestand teen hierdie effek. Maar aan die einde (en die begin) van tydreekse simmetriese tydreeks kan nie gebruik word nie. Met die oog op die stryk waardes in die beide kante van die tydreeks die asimmetriese filter gebruik word bereken, maar hulle veroorsaak dat die fase krag. Tags / Keywords: Jy kan kliek en sleep in die plot area in U zoom kan muis oor datapunte om die werklike waarde wat weergegee As daar 'n legende boks te sien, kliek op die naam reeks om weg te steek / toon hulle Introduction bewegende gemiddeldes is rekenkundige gemiddeldes van toepassing op opeenvolgende tyd strek van vaste lengte van die reeks. Wanneer dit toegepas word om die oorspronklike tydreekse produseer hulle 'n reeks van gemiddeld waardes. Die algemene formule vir bewegende gemiddelde M van koëffisiënte is: die bewegende gemiddeldes koëffisiënte is gewigte genoem. Die hoeveelheid p f 1 is die bewegende gemiddelde bestel. Die bewegende gemiddelde genoem gesentreer as die aantal waarnemings in die verlede is gelyk aan die aantal waarneming in die toekoms (bv as p gelyk is aan f). Bewegende gemiddeldes te vervang die oorspronklike tydreekse deur geweegde gemiddeldes van die huidige waardes, p Waarnemings voor die huidige waarneming en f Waarnemings na aanleiding van die huidige waarneming. Hulle word gebruik om die oorspronklike tydreekse gladder. Voorbeeld Die tabel toon die aantal passasiers gereis deur die lug deur Finland berig in 2001. Dieselfde data word op die grafiek: Tipe bewegende gemiddeldes op grond van gewig patrone, bewegende gemiddeldes kan wees: Simmetriese die gewig van patroon gebruik word vir die berekening van bewegende gemiddeldes is simmetries om die teiken data punt. Deur middel van simmetriese bewegende gemiddeldes is dit nie moontlik om die reëlmatige waardes vir die eerste p en laaste p waarnemings te verkry (vir simmetriese bewegende gemiddeldes PF). Voorbeeld Asimmetriese die gewig van patroon gebruik word vir die berekening van bewegende gemiddeldes is nie simmetries om die teiken data punt Voorbeeld bewegende gemiddeldes kan ook geklassifiseer word volgens hul bydrae tot die finale waarde as: Eenvoudige bewegende gemiddeldes, naamlik die bewegende gemiddeldes waarvoor alle gewigte is dieselfde in geval van 'n eenvoudige bewegende gemiddeldes al die waarnemings ewe bydra tot die finale waarde. Nodeloos om te sê, al eenvoudig bewegende gemiddeldes is simmetriese. Formeel, vir simmetriese bewegende gemiddelde van orde P 2p 1 al die gewigte is gelyk aan 1 / P. Voorbeeld Die prentjie hieronder vergelyk die mate van gladstryking bereik deur die toepassing van 3 termyn en 7 termyn eenvoudige bewegende gemiddeldes. Die uiterste Waarnemings (bv April 2010 of Junie 2011) het 'n laer impak op die langer bewegende gemiddelde as die korter een. Nie eenvoudige bewegende gemiddeldes, naamlik die bewegende gemiddeldes waarvoor alle gewigte is nie dieselfde nie. Die spesiale gevalle van nie-eenvoudige bewegende gemiddeldes is: Saamgestelde bewegende gemiddeldes, wat verkry word deur die saamstel van 'n eenvoudige bewegende gemiddelde van orde P, wie se koëffisiënte is almal gelyk aan 1 P en 'n eenvoudige bewegende gemiddelde van orde Q, wie se koëffisiënte is almal gelyk tot 1 Vraag Asimmetriese bewegende gemiddeldes. Eienskappe van bewegende gemiddeldes Die bewegende gemiddeldes gladder die tydreeks. Wanneer dit toegepas word om 'n tydreeks, verminder hulle die amplitude van die waargeneem skommelinge en op te tree as 'n filter wat onreëlmatige bewegings verwyder daaruit. Die bewegende gemiddeldes met toepaslike gewig patroon kan gebruik word om siklusse van 'n sekere lengte in die tyd reeks uit te skakel. In X-12-ARIMA seisoensaanpassing metode verskillende soorte bewegende gemiddeldes word gebruik om die tendens-siklus en seisoenale komponent skat. As die som van die koëffisiënte gelyk aan 1 is, dan is die bewegende gemiddelde behoud van die tendens. Bewegende gemiddeldes het twee belangrike gebreke: Hulle is nie sterk en kan diep geraak deur uitskieters Die smoothing aan die einde van die reeks kan nie gedoen word nie, maar met asimmetriese bewegende gemiddeldes watter fase verskuiwings en vertragings te voer in die opsporing van draaipunte in die X11 metode , simmetriese bewegende gemiddeldes speel 'n belangrike rol as hulle nie 'n faseverskuiwing in die stryk reeks bekend te stel. Maar, om te verhoed dat die verlies van inligting op die reeks eindig, is dit óf aangevul deur ad hoc asimmetriese bewegende gemiddeldes of toegepas op die reeks voltooi deur voorspellings. Reg boxMoving gemiddeldes bewegende gemiddeldes Met konvensionele datastelle die gemiddelde waarde is dikwels die eerste, en een van die mees bruikbare, opsommingstatistiek te bereken. Wanneer data in die vorm van 'n tydreeks, die reeks beteken is 'n nuttige maatstaf, maar nie die dinamiese aard van die data weerspieël. Gemiddelde waardes bereken oor kortsluiting periodes, hetsy voor die huidige tydperk of gesentreer op die huidige tydperk, is dikwels meer nuttig. Omdat so 'n gemiddelde waardes sal wissel, of beweeg, soos die huidige tydperk beweeg van tyd t 2, t 3. ens staan ​​hulle bekend as bewegende gemiddeldes (Mas). 'N Eenvoudige bewegende gemiddelde is (tipies) die ongeweegde gemiddelde van k voor waardes. 'N eksponensieel geweeg bewegende gemiddelde is in wese dieselfde as 'n eenvoudige bewegende gemiddelde, maar met bydraes tot die gemiddelde geweegde deur hul nabyheid aan die huidige tyd. Want daar is nie een nie, maar 'n hele reeks bewegende gemiddeldes vir enige gegewe reeks, die stel van Mas kan hulself getrek word op grafieke, ontleed as 'n reeks, en gebruik in die modellering en voorspelling. 'N verskeidenheid van modelle kan gebou word met behulp van bewegende gemiddeldes, en dit is bekend as MA modelle. As sulke modelle word gekombineer met outoregressiewe (AR) modelle die gevolglike saamgestelde modelle is bekend as ARMA of ARIMA modelle (die Ek is vir geïntegreerde). Eenvoudige bewegende gemiddeldes Sedert 'n tydreeks kan as 'n stel waardes beskou word,, t 1,2,3,4, N die gemiddeld van hierdie waardes kan bereken word. As ons aanvaar dat N is nogal groot, en ons kies 'n heelgetal k wat is veel kleiner as n. kan ons 'n stel van blok gemiddeldes, of eenvoudig bewegende gemiddeldes (van orde k) bereken: Elke maat verteenwoordig die gemiddelde van al die datawaardes oor 'n interval van k waarnemings. Let daarop dat die eerste moontlike MA van orde k gt0 is dat vir t k. Meer in die algemeen kan ons die ekstra onderskrif val in die uitdrukkings bo en skryf: Dit bepaal dat die geskatte gemiddelde op tydstip t is die eenvoudige gemiddelde van die waargeneem waarde op tydstip t en die voorafgaande k -1 tyd stappe. As gewigte word toegepas wat die bydrae van waarnemings wat verder weg in die tyd is verminder, is die bewegende gemiddelde gesê eksponensieel word stryk. Bewegende gemiddeldes word dikwels gebruik as 'n vorm van vooruitskatting, waardeur die beraamde waarde vir 'n reeks op tydstip t 1, S T1. geneem word as die MA vir die tydperk tot en met tyd t. bv vandag se skatting is gebaseer op 'n gemiddelde van vorige aangeteken waardes tot en met gister se (vir daaglikse data). Eenvoudige bewegende gemiddeldes kan gesien word as 'n vorm van gladstryking. In die onderstaande diagram getoon word byvoorbeeld het die lugbesoedeling dataset getoon in die inleiding tot hierdie onderwerp is aangevul deur 'n 7-daagse bewegende gemiddelde (MA) reël, hier in rooi. Soos gesien kan word, die MA lyn glad uit die pieke en trôe in die data en kan baie nuttig wees in die identifisering van tendense wees. Die standaard toekomsgerigte berekening formule beteken dat die eerste k -1 datapunte het geen MA waarde, maar daarna berekeninge uit te brei na die finale data punt in die reeks. PM10 daaglikse gemiddelde waardes, Greenwich bron: London Luggehalte Network, www. londonair. org. uk Een rede vir die berekening van eenvoudige bewegende gemiddeldes op die voorgeskrewe wyse, is dat dit in staat stel om waardes te bereken vir alle tydgleuwe van tyd tk tot op hede en as 'n nuwe meting verkry vir tyd t 1, die MA vir tyd t 1 kan die reeds bereken stel bygevoeg. Dit bied 'n eenvoudige prosedure vir 'n dinamiese datastelle. Daar is egter 'n paar probleme met hierdie benadering. Dit is redelik om te argumenteer dat die gemiddelde waarde van die afgelope 3 periodes, sê, moet geleë wees op tyd t -1, nie tyd t. en vir 'n MA oor 'n gelyke getal periodes miskien is dit moet geleë wees by die middelpunt tussen twee tyd intervalle. 'N oplossing vir hierdie probleem is om gesentreer MA berekeninge, waarin die MA op tydstip t is die gemiddeld van 'n simmetriese stel waardes rondom t gebruik. Ten spyte van die ooglopende meriete, is hierdie benadering nie oor die algemeen gebruik word, want dit vereis dat data is beskikbaar vir toekomstige gebeure, wat nie die geval mag wees. In gevalle waar analise is geheel en al van 'n bestaande reeks, kan die gebruik van gesentreer Mas beter wees. Eenvoudige bewegende gemiddeldes kan beskou word as 'n vorm van gladstryking, die verwydering van 'n paar hoë frekwensie komponente van 'n tydreeks en beklemtoon (maar nie die verwydering van) tendense in 'n soortgelyke wyse as die algemene opvatting van digitale filter. Inderdaad, bewegende gemiddeldes is 'n vorm van lineêre filter. Dit is moontlik om 'n bewegende gemiddelde berekening van toepassing op 'n reeks wat reeds stryk, dit wil sê glad of filter 'n reeds stryk reeks. Byvoorbeeld, met 'n bewegende gemiddelde van orde 2, ons kan dit beskou as synde bereken met behulp van gewigte, sodat die MA by x 2 0.5 x 1 0.5 x 2. Net so, die MA by x 3 0.5 x 2 0.5 x 3. As ons dien 'n tweede vlak van gladstryking of filter, ons het 0,5 x 2 0.5 x 3 0.5 (0.5 x 1 0.5 x 2) 0.5 (0.5 x 2 0.5 x 3) 0.25 x 1 0.5 x 2 0,25 x 3 dws die 2-stadium filter proses (of konvolusie) het 'n wisselvallig geweegde simmetriese bewegende gemiddelde, met gewigte vervaardig. Veelvuldige konvolusie kan ingewikkeld geweegde bewegende gemiddeldes, waarvan sommige is gevind veral gebruik in gespesialiseerde velde, soos in lewensversekering berekeninge te produseer. Bewegende gemiddeldes gebruik kan word om periodieke effekte verwyder indien bereken met die lengte van die periodisiteit as 'n bekende. Byvoorbeeld, met 'n maandelikse data seisoenale variasies dikwels verwyder kan word (indien dit die doel) deur toe te pas 'n simmetriese 12 maande bewegende gemiddelde met al maande gelyke gewigte, behalwe die eerste en laaste wat geweeg deur 1/2. Dit is omdat daar sal 13 maande in die simmetriese model (huidige tyd, t / -. 6 maande). Die totale is gedeel deur 12. Soortgelyke prosedures kan vir enige goed gedefinieerde periodisiteit word aangeneem. Eksponensieel geweeg bewegende gemiddeldes (EWMA) Met die eenvoudige bewegende gemiddelde formule: alle waarnemings is ewe geweegde. As ons noem hulle die gelyke gewigte, Alpha t. elk van die k gewigte sou gelyk 1 / k. sodat die som van die gewigte sal wees 1, en die formule sou wees: Ons het reeds gesien dat verskeie programme van hierdie proses lei tot die gewigte wissel. Met eksponensieel geweeg bewegende gemiddeldes die bydrae tot die gemiddelde waarde van waarnemings wat meer verwyder betyds beraadslaag verminder, en sodoende meer onlangse (plaaslike) gebeure beklemtoon. In wese 'n glad parameter, 0lt Alpha LT1, is bekend gestel, en die formule hersien om 'n simmetriese weergawe van hierdie formule van die vorm sal wees: As die gewigte in die simmetriese model is gekies as die terme van die bepalings van die binomiale uitbreiding, (1/21/2) 2S. hulle sal vat om 1, en as Q groot word, sal die normaalverdeling benader. Dit is 'n vorm van kern gewig, met die Binomiale optree as die kern funksie. Die twee stadium konvolusie in die vorige subartikel beskryf is juis hierdie reëling, met Q 1, opbrengs die gewigte. In eksponensiële gladstryking is dit nodig om 'n stel gewigte gebruik wat som tot 1 en wat verminder in grootte meetkundig. Die gewigte gebruik is tipies van die vorm: Om te wys dat hierdie gewigte op te som tot 1, oorweeg die uitbreiding van 1 / as 'n reeks. Ons kan skryf en die uitdrukking in hakies gebruik te maak van die binomiale formule (1- x) p brei. waar x (1-) en p -1, wat gee: Dit bied dan 'n vorm van geweegde bewegende gemiddelde van die vorm: Hierdie opsomming kan geskryf word as 'n herhaling verhouding: wat berekening grootliks vereenvoudig, en vermy die probleem wat die gewig regime moet streng oneindige wees vir die gewigte op te som tot 1 (vir klein waardes van alfa. hierdie is tipies nie die geval). Die notasie wat gebruik word deur verskillende skrywers wissel. Sommige gebruik die letter S aan te dui dat die formule is in wese 'n reëlmatige veranderlike, en skryf: terwyl die beheerteorie literatuur gebruik dikwels Z eerder as S vir die eksponensieel geweeg of glad waardes (sien, byvoorbeeld, Lucas en Saccucci, 1990, LUC1 , en die NIST webwerf vir meer besonderhede en uitgewerkte voorbeelde). Bogenoemde aangehaal formules uit die werk van Roberts (1959 ROB1), maar Hunter (1986, HUN1) gebruik 'n uitdrukking van die vorm: wat meer geskik is vir gebruik in 'n paar prosedures kan wees. Met alfa 1 die gemiddelde skatting is eenvoudig sy gemeet waarde (of die waarde van die vorige data-item). Met 0,5 die skatting is die eenvoudige bewegende gemiddelde van die huidige en vorige metings. In voorspellingsmodelle die waarde, S t. word dikwels gebruik as die skatting of voorspelling waarde vir die volgende tydperk, dit wil sê as die skatting vir x op tydstip t 1. So ons het: Dit dui aan dat die voorspelling waarde op tydstip t 1 is 'n kombinasie van die vorige eksponensieel geweeg bewegende gemiddelde plus 'n komponent wat die geweegde voorspelling fout, Epsilon verteenwoordig. op tyd t. Die aanvaarding van 'n tydreeks gegee en 'n voorspelling is nodig, word 'n waarde vir Alpha vereis. Dit kan geskat word van die bestaande data deur die evaluering van die som van 'n vierkant voorspelling foute te kry met wisselende waardes van Alpha vir elke T 2,3. die opstel van die eerste skatting van die eerste waargenome data waarde wees, x 1. In beheer aansoeke ter waarde van Alpha is belangrik in wat gebruik word in die bepaling van die boonste en onderste beheer perke, en raak die gemiddelde duur lank (ARL) verwag voor hierdie beheer perke is gebreek (onder die aanname dat die tyd reeks verteenwoordig 'n stel van ewekansige, identies verdeelde onafhanklike veranderlikes met 'n gemeenskaplike variansie). Onder hierdie omstandighede die variansie van die beheer statistiek: is (Lucas en Saccucci, 1990): beheer perke word gewoonlik gestel as vaste veelvoude van hierdie asimptotiese variansie, bv / - 3 keer die standaardafwyking. 1,134 en die proses sal een of ander perk in 500 bereik - As alfa 0,25, byvoorbeeld, en die data wat gemonitor word aangeneem dat 'n normale verspreiding, N (0,1) het, terwyl dit in beheer, die beheer perke sal / kan stappe op die gemiddelde. Lucas en Saccucci (1990 LUC1) lei die ARLs vir 'n wye verskeidenheid van alfa waardes en onder verskillende aannames met behulp van Markov Chain prosedures. Hulle tabuleer die resultate, insluitend die verskaffing van ARLs wanneer die gemiddelde van die beheerproses is verskuif deur sommige verskeie van die standaardafwyking. Byvoorbeeld, met 'n 0.5 verskuiwing met alfa 0,25 die ARL is minder as 50 keer stappe. Die hierbo beskryf benaderings staan ​​bekend as een eksponensiële gladstryking. as die prosedures wat eenmaal aan die tydreeks toegepas en dan ontleed of beheer prosesse uit op die gevolglike stryk dataset gedra. As die dataset sluit 'n tendens en / of seisoenale komponente, twee - of drie-fase eksponensiële gladstryking kan hieronder toegedien word as 'n middel van die verwydering (uitdruklik modellering) hierdie effekte (sien verder, die afdeling oor vooruitskatting., En die NIST uitgewerkte voorbeeld ). CHA1 Chat Field C (1975) die ontleding van Times Reeks: teorie en praktyk. Chapman en Hall, Londen HUN1 Hunter J S (1986) Die eksponensieel geweeg bewegende gemiddelde. J van kwaliteit Tegnologie, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) eksponensieel Geweegde Moving Gemiddelde beheer Skemas: Properties en verbeteringe. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) beheer Chart Toetse Op grond van Meetkundige bewegende gemiddeldes. Technometrics, 1, 239-2506,2 bewegende gemiddeldes ma 40 elecsales, sodat 5 41 In die tweede kolom van hierdie tabel, 'n bewegende gemiddelde van orde 5 aangetoon, die verskaffing van 'n skatting van die tendens-siklus. Die eerste waarde in hierdie kolom is die gemiddeld van die eerste vyf Waarnemings (1989-1993) die tweede waarde in die 5-MA kolom is die gemiddeld van die waardes 1990-1994 en so aan. Elke waarde in die 5-MA kolom is die gemiddeld van die waarnemings in die tydperk van vyf jaar gesentreer op die ooreenstemmende jaar. Daar is geen waardes vir die eerste twee jaar of laaste twee jaar, want ons hoef nie twee waarnemings aan weerskante. In die formule hierbo, kolom 5-MA bevat die waardes van hoed met K2. Om te sien wat die tendens-siklus skatting lyk, stip ons dit saam met die oorspronklike data in figuur 6.7. plot 40 elecsales, hoof quotResidential elektrisiteit salesquot, ylab quotGWhquot. XLab quotYearquot 41 lyne 40 MA 40 elecsales, 5 41. Kol quotredquot 41 Let op hoe die tendens (in rooi) is gladder as die oorspronklike data en vang die grootste beweging van die tydreeks sonder al die geringe fluktuasies. Die bewegende gemiddelde metode nie skattings van T toelaat waar t is baie naby aan die einde van die reeks vandaar die rooi lyn nie uit te brei na die kante van die grafiek aan weerskante. Later sal ons meer gesofistikeerde metodes van die tendens-siklus skatting wat doen toelaat skattings naby die eindpunte gebruik. Die einde van die bewegende gemiddelde bepaal die gladheid van die tendens-siklus skatting. In die algemeen, 'n groter orde beteken 'n gladder kurwe. Die volgende grafiek toon die effek van die verandering van die orde van die bewegende gemiddelde vir die residensiële verkope elektrisiteit data. Eenvoudige bewegende gemiddeldes soos hierdie is gewoonlik van vreemde orde (bv 3, 5, 7, ens) Dit is sodat hulle is simmetries: in 'n bewegende gemiddelde van orde m2k1, daar is k vroeër waarnemings, k later waarnemings en die Midde-waarneming wat gemiddeld. Maar as m selfs was, sou dit nie meer simmetriese wees. Bewegende gemiddeldes van bewegende gemiddeldes Dit is moontlik om 'n bewegende gemiddelde van toepassing op 'n bewegende gemiddelde. Een van die redes hiervoor is om 'n nog-orde bewegende gemiddelde simmetriese maak. Byvoorbeeld, kan ons 'n bewegende gemiddelde van orde 4 neem, en dan nog 'n bewegende gemiddelde van orde 2 van toepassing is op die resultate. In Tabel 6.2, is dit gedoen en vir die eerste paar jaar van die Australiese kwartaallikse bier produksie data. BEER2 LT venster 40 ausbeer, begin 1992 41 ma4 LT ma 40 BEER2, sodat 4. sentrum ONWAAR 41 ma2x4 LT ma 40 BEER2, sodat 4. sentrum WAAR 41 Die notasie 2times4-MA in die laaste kolom beteken 'n 4-MA gevolg deur 'n 2-MA. Die waardes in die laaste kolom word verkry deur die neem van 'n bewegende gemiddelde van orde 2 van die waardes in die vorige kolom. Byvoorbeeld, die eerste twee waardes in die 4-MA kolom is 451,2 (443.410.420.532) / 4 en 448,8 (410.420.532.433) / 4. Die eerste waarde in die 2times4-MA kolom is die gemiddeld van die twee: 450,0 (451.2448.8) / 2. Wanneer 'n 2-MA volg op 'n bewegende gemiddelde van al orde (soos 4), is dit bekend as 'n gesentreerde bewegende gemiddelde van orde 4. Dit is omdat die resultate is nou simmetriese. Om te sien dat dit die geval is, kan ons die 2times4-MA soos volg skryf: begin hoed amp frac Bigfrac (J J J J) frac (J J J J) Big amp frac y frac14y frac14y frac14y frac18y. Uiteindelik gaan dit nou 'n geweegde gemiddelde van waarnemings, maar dit is simmetriese. Ander kombinasies van bewegende gemiddeldes is ook moontlik. Byvoorbeeld 'n 3times3-MA word dikwels gebruik, en bestaan ​​uit 'n bewegende gemiddelde van orde 3 gevolg deur 'n ander bewegende gemiddelde van orde 3. In die algemeen, moet 'n gelyke orde MA word gevolg deur 'n nog bevel MA dit simmetriese maak. Net so moet 'n vreemde orde MA word gevolg deur 'n vreemde orde MA. Skatte van die tendens-siklus met seisoenale data Die mees algemene gebruik van gesentreer bewegende gemiddeldes is in die beraming van die tendens-siklus van seisoenale data. Oorweeg die 2times4-MA: hoed frac y frac14y frac14y frac14y frac18y. Wanneer dit toegepas word om kwartaalliks data, word elke kwartaal van die jaar gegee gelyke gewig as die eerste en laaste terme van toepassing op dieselfde kwartaal in agtereenvolgende jare. Gevolglik sal die seisoenale variasie word gemiddeld uit en die gevolglike waardes van hoed t sal min of oorblywende geen seisoenale variasie het. 'N soortgelyke effek sal verkry word met behulp van 'n 2times 8-MA of 'n 2times 12-MA. In die algemeen, 'n 2times m-MA is gelykstaande aan 'n geweegde bewegende gemiddelde van orde M1 met alle waarnemings wat gewig 1 / m, behalwe vir die eerste en laaste terme wat gewigte neem 1 / (2 miljoen). So as die seisoenale tydperk is selfs en orde m, gebruik 'n 2times m-MA aan die tendens-siklus te skat. As die seisoenale tydperk is vreemd en orde m, gebruik 'n m-MA aan die tendens siklus skat. In die besonder, kan 'n 2times 12-MA gebruik word om die tendens-siklus van maandelikse data te skat en 'n 7-MA gebruik kan word om die tendens-siklus van die daaglikse data te skat. Ander keuses vir die einde van die MA sal gewoonlik lei tot tendens-siklus skattings besmet deur die seisoenaliteit in die data. Voorbeeld 6.2 Elektriese toerusting vervaardiging Figuur 6.9 toon 'n 2times12-MA toegepas op die elektriese toerusting bestellings indeks. Let daarop dat die gladde lyn toon geen seisoenaliteit dit is byna dieselfde as die tendens-siklus word in Figuur 6.2 wat na raming met behulp van 'n veel meer gesofistikeerde metode as bewegende gemiddeldes. Enige ander keuse vir die einde van die bewegende gemiddelde (behalwe vir 24, 36, ens) sou gelei tot 'n gladde lyn wat 'n paar seisoenale skommelinge toon. plot 40 elecequip, ylab quotNew bestellings indexquot. Kol quotgrayquot, hoof quotElectrical toerusting vervaardiging (Eurogebied) quot 41 lyne 40 MA 40 elecequip, sodat 12 41. Kol quotredquot 41 Geweegde bewegende gemiddeldes Kombinasies van bewegende gemiddeldes lei tot geweegde bewegende gemiddeldes. Byvoorbeeld, die 2x4-MA hierbo bespreek is gelykstaande aan 'n geweegde 5-MA met gewigte deur frac, frac, frac, frac, frac. In die algemeen kan 'n geweegde m-MA geskryf word as hoed t som k AJ y, waar k (m-1) / 2 en die gewigte word deur 'n, kolle, AK. Dit is belangrik dat die gewigte al som tot een en dat hulle simmetriese sodat 'n aj. Die eenvoudige m-MA is 'n spesiale geval waar al die gewigte is gelyk aan 1 / m. 'N Groot voordeel van geweegde bewegende gemiddeldes is dat hulle toegee n gladder skatting van die tendens-siklus. In plaas van waarnemings betree en verlaat die berekening op volle gewig, is hul gewigte stadig toegeneem en dan stadig afgeneem wat lei tot 'n gladder kurwe. Sommige spesifieke stelle gewigte is wyd gebruik word. Sommige van hierdie word in Tabel 6.3.Time Series Analysis: Die Proses van seisoensaanpassings Wat is die twee belangrikste filosofieë van seisoenale aanpassing Wat is 'n filter Wat is die eindpunt probleem Hoe weet ons besluit watter filter gebruik Wat is 'n aanwins funksie wat is 'n fase skuif wat Henderson bewegende gemiddeldes Hoe hanteer ons die eindpunt probleem wat seisoenaal bewegende gemiddeldes Hoekom is tendens skattings hersiene Hoeveel data is nodig om te bekom aanvaarbare seisoensaangepaste skattings GEVORDERDE Hoe verskil die twee seisoenale aanpassing filosofieë vergelyk wat is die twee belangrikste filosofieë van seisoensaanpassings die twee belangrikste filosofieë vir seisoenale aanpassing is die model gebaseerde metode en die filter gebaseer metode. Filter gebaseerde metodes Hierdie metode is van toepassing 'n stel van vaste filters (bewegende gemiddeldes) om die tydreeks ontbind in 'n tendens, seisoenale en onreëlmatige komponent. Die onderliggende idee is dat ekonomiese data bestaan ​​uit 'n reeks van siklusse, insluitend sakesiklusse (die tendens), seisoenale siklusse (seisoenaliteit) en geraas (die onreëlmatige komponent). 'N filter wese verwyder of verminder die krag van sekere siklusse van die insette data. Om 'n seisoensaangepaste reeks van data maandelikse ingesamel, gebeure wat plaasvind elke 12, 6, 4, 3, 2.4 en 2 maande moet verwyder word te produseer. Hierdie stem ooreen met seisoenale frekwensies van 1, 2, 3, 4, 5 en 6 siklusse per jaar. Hoe langer nie-seisoenale siklusse word beskou as deel van die tendens en die korter nie-seisoenale siklusse vorm die onreëlmatige wees. Maar die grens tussen die tendens en onreëlmatige siklusse kan wissel met die lengte van die filter wat gebruik word om die tendens te kry. In ABS seisoenale aanpassing, siklusse wat aansienlik bydra tot die tendens is tipies groter as ongeveer 8 maande vir maandelikse reeks en 4/4 vir kwartaallikse reeks. Die tendens, seisoenale en onreëlmatige komponente nie eksplisiete individuele modelle nodig. Die onreëlmatige komponent word gedefinieer as wat oorbly na die tendens en seisoenale komponente is verwyder deur filters. Irregulars nie wit geraas eienskappe vertoon. Filter gebaseerde metodes word dikwels bekend as X11 styl metodes. Dit sluit in X11 (ontwikkel deur Amerikaanse Sensus Buro), X11ARIMA (ontwikkel deur Statistiek Kanada), X12ARIMA (ontwikkel deur Amerikaanse Sensus Buro), STL, SABL en SEASABS (die pakket wat gebruik word deur die ABS). Computational verskille tussen verskillende metodes in X11 familie is hoofsaaklik die gevolg van verskillende tegnieke wat gebruik word in die uithoeke van die tydreeks. Byvoorbeeld, sommige metodes gebruik asimmetriese filters aan die einde, terwyl ander metodes ekstrapoleer die tydreeks en simmetriese filters toe te pas om die uitgebreide reeks. Model gebaseerde metodes Hierdie benadering vereis dat die tendens, seisoenale en onreëlmatige komponente van die tydreeks apart geskoei. Dit veronderstel die onreëlmatige komponent is 8220white noise8221 - dit is al siklus lengtes is ewe verteenwoordig. Die onreëlmatig het 'n zero gemiddelde en 'n konstante stryd. Die seisoenale komponent het sy eie geraas element. Twee wyd gebruik sagteware pakkette wat model gebaseerde metodes kan toepas stempel en SITPLEKKE / TRAMO (ontwikkel deur die Bank van Spanje. Groot computational verskille tussen die verskillende model gebaseerde metodes is gewoonlik as gevolg van spesifikasies model. In sommige gevalle is die komponente direk geskoei. ander metodes vereis dat die oorspronklike tydreekse eers geskoei, en die komponent modelle ontbinde van daardie. vir 'n vergelyking van die twee filosofieë op 'n meer gevorderde vlak, sien Hoe die twee seisoenale aanpassing filosofieë vergelyk wat is 'n filter filters gebruik kan word 'n tydreeks in 'n tendens, seisoenale en onreëlmatige komponent ontbind. bewegende gemiddeldes is 'n soort van filter wat agtereenvolgens gemiddeld 'n verskuiwing tydsduur van data ten einde 'n reëlmatige skatting van 'n tydreeks te produseer. dit stryk reeks oorweeg kan word om is afgelei deur die loop insette reeks deur 'n proses wat h filters uit sekere siklusse. Gevolglik is 'n bewegende gemiddelde is dikwels na verwys as 'n filter. Die basiese proses behels die definisie van 'n stel gewigte van lengte m 1 m 2 1 as: Let wel: 'n simmetriese stel gewigte het m 1 m 2 en WJW - J 'n gefilterde waarde op tydstip t kan bereken word deur waar Y t beskryf die waarde van die tydreeks op tydstip t. Byvoorbeeld, kyk na die volgende reekse: Die gebruik van 'n eenvoudige 3 termyn simmetriese filter (bv m 1 m 2 1 en al gewigte is 1/3), die eerste kwartaal van die reëlmatige reeks word verkry deur die toepassing van die gewigte aan die eerste drie kwartale van die oorspronklike reeks: die tweede stryk waarde is vervaardig deur die toepassing van die gewigte aan die tweede, derde en vierde kwartale in die oorspronklike reeks: Wat is die eindpunt PROBLEEM Heroorweeg die reeks: Hierdie reeks bevat 8 terme. Maar die stryk reeks verkry deur die toepassing van simmetriese filter om die oorspronklike data bevat slegs 6 terme: Dit is omdat daar nie genoeg data aan die einde van die reeks 'n simmetriese filter toe te pas. Die eerste kwartaal van die reëlmatige reeks is 'n geweegde gemiddelde van drie terme, gesentreer op die tweede kwartaal van die oorspronklike reeks. 'N Geweegde gemiddelde gesentreer op die eerste kwartaal van die oorspronklike reeks kan nie verkry word as data voor hierdie punt is nie beskikbaar nie. Net so is dit nie moontlik om 'n geweegde gemiddelde gesentreer op die laaste kwartaal van die reeks te bereken, want daar is geen data na hierdie punt. Om hierdie rede, kan simmetriese filters nie gebruik word op beide kante van 'n reeks. Dit staan ​​bekend as die eindpunt probleem. Tydreeks ontleders kan asimmetriese filters gebruik om reëlmatige skattings in hierdie streke te produseer. In hierdie geval, is die reëlmatige waarde bereken 8216off centre8217, met die gemiddelde bepaal word met behulp van meer data van die een kant van die punt as die ander volgens wat beskikbaar is. Alternatiewelik kan modelleringstegnieke gebruik word om die tydreeks te ekstrapoleer en dan simmetriese filters toe te pas om die uitgebreide reeks. HOE ONS besluit watter FILTER om te gebruik Die tydreekse ontleder kies 'n geskikte filter op grond van sy eienskappe, soos wat siklusse die filter verwyder wanneer dit toegepas word. Die eienskappe van 'n filter ondersoek kan word met behulp van 'n wins funksie. Kry funksies word gebruik om die effek van 'n filter op 'n gegewe frekwensie op die amplitude van 'n siklus vir 'n bepaalde tyd reeks te ondersoek. Vir meer besonderhede oor die wiskunde wat verband hou met wins funksies, kan jy die aflaai van die Tyd Reeks kursusnotas, 'n inleidende gids tot tydreeksanalise uitgegee deur die Tydreeksanalise Afdeling van die ABS (verwys na afdeling 4.4). Die volgende diagram is die wins funksie vir die simmetriese 3 termyn filter ons vroeër bestudeer. Figuur 1: Kry funksie vir Simmetriese 3 Kwartaal Filter Die horisontale as stel die lengte van 'n inset-siklus met betrekking tot die tydperk tussen waarneming punte in die oorspronklike tyd reeks. So 'n inset-siklus van lengte 2 voltooi is in 2 periodes, wat 2 maande vir 'n maandelikse reeks, en 2/4 vir 'n kwartaallikse reeks verteenwoordig. Die vertikale as dui die amplitude van die uitset-siklus met betrekking tot 'n inset-siklus. Dit filter verminder die krag van 3 tydperk siklusse aan nul. Dit wil sê, dit heeltemal verwyder siklusse van ongeveer hierdie lengte. Dit beteken dat vir 'n tydreeks waar data maandelikse versamel, enige seisoenale effekte wat kwartaalliks voorkom sal uitgeskakel word deur die toepassing van hierdie filter om die oorspronklike reeks. A faseverskuiwing is die tyd verskuiwing tussen die gefilterde siklus en die ongefiltreerde siklus. 'N Positiewe faseverskuiwing beteken dat die gefilterde siklus agtertoe geskuif en 'n negatiewe fase skuif dit verskuif voorspelers in die tyd. Fase verskuiwing vind plaas wanneer tydsberekening van draaipunte is verdraai, byvoorbeeld wanneer die bewegende gemiddelde is geplaas off-sentrum deur die asimmetriese filters. Dit is, sal hulle óf vroeër of later in die gefilterde reeks, as in die oorspronklike voorkom. Vreemd lengte simmetriese bewegende gemiddeldes (soos gebruik deur die ABS), waar die uitslag sentraal geplaas word, veroorsaak nie tyd faseverskuiwing. Dit is belangrik vir filters wat gebruik word om die tendens om die tyd fase behou lei, en vandaar die tydsberekening van enige draaipunte. Syfers 2 en 3 toon die uitwerking van die toepassing van 'n 2x12 simmetriese bewegende gemiddelde wat off-sentrum. Die deurlopende kurwes verteenwoordig die aanvanklike siklusse en die gebreekte kurwes verteenwoordig die uitset siklusse na die toepassing van die bewegende gemiddelde filter. Figuur 2: 24 maande siklus, Fase -5,5 maande Amplitude 63 Figuur 3: 8 maande siklus, Fase -1,5 maande Amplitude 22 WAT IS HENDERSON bewegende gemiddeldes Henderson bewegende gemiddeldes is filters wat deur Robert Henderson is afgelei in 1916 vir gebruik in aktuariële programme. Hulle is tendens filters, wat algemeen gebruik word in tydreeksanalise om seisoenaal aangepaste beramings glad ten einde 'n tendens beraming te genereer. Hulle word gebruik in die voorkeur aan eenvoudiger bewegende gemiddeldes, want hulle polinome van kan reproduseer tot graad 3 en sodoende vas te lê tendens draaipunte. Die ABS gebruik Henderson bewegende gemiddeldes te tendens skat produseer van 'n seisoensaangepaste reeks. Die tendens skattings gepubliseer deur die ABS is tipies afgelei met behulp van 'n 13 termyn Henderson filter vir maandelikse reeks, en 'n 7 termyn Henderson filter vir kwartaallikse reeks. Henderson filters kan óf simmetriese of asimmetriese wees. Simmetriese bewegende gemiddeldes toegepas kan word op punte wat voldoende is ver weg van die kante van 'n tydreeks. In hierdie geval, is die reëlmatige waarde vir 'n gegewe punt in die tyd reeks bereken vanaf 'n gelyke aantal waardes aan weerskante van die data punt. Om die gewigte te kry, is 'n kompromie getref tussen die twee eienskappe algemeen verwag van 'n tendens reeks. Dit is dat die tendens sal in staat wees om 'n wye verskeidenheid van kurwes verteenwoordig en dat dit moet ook so glad as moontlik te wees. Vir die wiskundige afleiding van die gewigte, verwys na afdeling 5.3 van die Tyd Reeks kursusnotas. wat kan vry wees van die ABS webwerf afgelaai word. Die gewig patrone vir 'n verskeidenheid van simmetriese Henderson bewegende gemiddeldes word in die volgende tabel: Simmetriese Gewig Patroon vir Henderson bewegende gemiddelde In die algemeen, hoe langer die tendens filter, die gladder die gevolglike tendens, soos blyk uit 'n vergelyking van die wins funksies hierbo. A 5 termyn Henderson verminder siklusse van ongeveer 2.4 tydperke of minder deur ten minste 80, terwyl 'n 23 termyn Henderson verminder siklusse van ongeveer 8 periodes of minder deur ten minste 90. In werklikheid 'n 23 termyn Henderson filter heeltemal verwyder siklusse van minder as 4 periodes . Henderson bewegende gemiddeldes ook demp die seisoenale siklusse in wisselende grade. Maar die wins funksies in figure 4-8 toon dat die jaarlikse siklusse in maandelikse en kwartaallikse reeks nie beduidend genoeg om te regverdig toepassing van 'n Henderson filter direk na die oorspronklike raming is gedemp. Dit is die rede waarom hulle net toegepas word om 'n seisoensaangepaste reeks, waar die kalender verwante effekte is reeds verwyder word met spesifiek ontwerp filters. Figuur 9 toon die glad gevolge van die toepassing van 'n Henderson filter om 'n reeks: Figuur 9: 23-Term Henderson Filter - waarde van nie-residensiële gebou goedkeurings HOE hanteer ons die eindpunt probleem Die simmetriese Henderson filter kan slegs toegepas word op gebiede data wat voldoende is ver van die einde van die reeks. Byvoorbeeld die standaard 13 termyn Henderson kan slegs toegepas word op maandelikse data wat ten minste 6 waarnemings van die begin of einde van die data. Dit is omdat die filter gladheid die reeks deur die neem van 'n geweegde gemiddelde van die 6 terme aan weerskante van die data punt asook die punt self. As ons probeer om dit toe te pas op 'n punt wat minder as 6 waarnemings van die einde van die data, dan is daar nie genoeg inligting beskikbaar op die een kant van die punt om die gemiddelde te bereken. Om tendens skattings van hierdie datapunte verskaf, is 'n aangepaste of asimmetriese bewegende gemiddelde gebruik. Berekening van asimmetriese Henderson filters kan gegenereer word deur 'n aantal verskillende metodes wat soortgelyk, maar nie identies resultate te lewer. Die vier belangrikste metodes is die Musgrave metode, die Minimalisering van die gemiddelde-kwadraat Hersiening metode, die beste lineêre onsydige Beramings (Blue) metode, en die Kenny en Durbin metode. Shiskin et. al (1967) afgelei van die oorspronklike asimmetriese gewigte vir die Henderson bewegende gemiddelde wat gebruik word in die X11 pakkette. Vir meer inligting oor die herkoms van die asimmetriese gewigte, sien afdeling 5.3 van die Tyd Reeks kursusnotas. Oorweeg 'n tydreeks waar die laaste waargenome data punt kom ten tye N. Dan is 'n 13 term simmetriese Henderson filter kan nie toegepas word op data punte wat gemeet te eniger tyd na en met tyd N-5. Vir al hierdie punte, moet 'n asimmetriese stel gewigte gebruik word. Die volgende tabel gee die asimmetriese gewig patroon vir 'n standaard 13 termyn Henderson bewegende gemiddelde. Die asimmetriese 13 termyn Henderson filters nie verwyder of demp dieselfde siklusse as die simmetriese 13 termyn Henderson filter. In die feit dat die asimmetriese gewig patroon gebruik om die tendens op die laaste waarneming skat versterk die krag van 12 tydperk siklusse. Ook asimmetriese filters produseer 'n geruime tyd faseverskuiwing. WAT is seisoenaal bewegende gemiddeldes Byna al die ondersoek deur die ABS data het seisoenale kenmerke. Sedert die Henderson bewegende gemiddeldes gebruik om die tendens reeks skat nie seisoenaliteit nie uit te skakel, moet die data seisoenaal aangepas eerste gebruik van seisoenale filters. 'N seisoenale filter het gewigte wat toegepas word om dieselfde tydperk met verloop van tyd. 'N Voorbeeld van die gewig patroon vir 'n seisoenale filter sal wees: (1/3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1/3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1/3) waar, byvoorbeeld, 'n gewig van 'n derde is van toepassing op drie agtereenvolgende Januarys. Binne X11, 'n verskeidenheid van seisoenale filters is beskikbaar om van te kies. Dit is 'n geweegde 3 termyn bewegende gemiddelde (MA) S 3x1. geweegde 5 termyn ma S 3x3. geweegde 7 termyn ma S 3x5. en 'n geweegde 11-termyn ma S 3x9. Die gewig struktuur van geweegde bewegende gemiddeldes van die vorm, S nxm. is dat 'n eenvoudige gemiddelde van m terme bereken, en dan 'n bewegende gemiddelde van N van hierdie gemiddeldes bepaal. Dit beteken dat nm-1 terme word gebruik om elke laaste stryk waarde te bereken. Byvoorbeeld, 'n 11-termyn S 3x9 bereken. 'n gewig van 1/9 toegepas met dieselfde tydperk in 9 agtereenvolgende jaar. Dan is 'n eenvoudige 3 termyn bewegende gemiddelde word oor die gemiddelde waardes: Dit gee 'n finale gewig patroon van (1/27, 2/27, 09/01, 09/01, 09/01, 09/01, 09/01, 09/01, 09/01, 27/02, 27/01). Die wins funksie vir 'n 11 termyn seisoenale filter, S 3x9. lyk: Figure 10: Kry funksie vir 11 term (e 3x9) Seisoene Filter Toepassing van 'n seisoenale filter om data sal 'n skatting van die seisoen komponent van die tydreeks te genereer, want dit behou die krag van seisoenale harmonieke en smoor siklusse van nie - seisoenale lengtes. Asimmetriese seisoenale filters word gebruik aan die einde van die reeks. Die asimmetriese gewigte vir elk van die seisoenale filters gebruik in X11 kan gevind word in artikel 5.4 van die Tyd Reeks kursusnotas. WAAROM IS TREND RAMINGS HERSIENE Teen die huidige einde van 'n tydreeks, is dit nie moontlik om simmetriese filters gebruik om die tendens te skat as gevolg van die eindpunt probleem. In plaas daarvan, is asimmetriese filters wat gebruik word om voorlopige tendens skat produseer. Maar, soos meer data beskikbaar raak, is dit moontlik om die tendens met behulp van simmetriese filters herbereken en die verbetering van die aanvanklike ramings. Dit staan ​​bekend as 'n tendens hersiening. Hoeveel data nodig om aanvaarbare SEISOENSAANGEPASTE RAMINGS verwerf indien 'n tydreeks uitstallings relatief stabiel seisoenaliteit en nie oorheers word deur die onreëlmatige komponent, kan dan 5 jaar van data word beskou as 'n aanvaarbare lengte te seisoensaangepaste skattings trek uit. Vir 'n reeks wat besonder sterk en stabiele seisoenaliteit toon, kan 'n ru-aanpassing word gemaak met 3 jaar van data. Dit is oor die algemeen beter om ten minste 7 jaar van data vir 'n normale tydreekse het, om seisoenale patrone, handel dag en beweeg vakansie effekte, tendens en seisoenale breek, asook uitskieters presies te identifiseer. ADVANCED Hoe verskil die TWEE seisoensaanpassings filosofieë VERGELYK Model-gebaseerde benaderings voorsiening te maak vir die stogastiese eienskappe (willekeur) van die reeks onder ontleding, in die sin dat hulle op maat van die filter gewigte gebaseer op die aard van die reeks. Die model8217s vermoë om akkuraat te beskryf die gedrag van die reeks geëvalueer kan word, en statistiese afleidings vir die skattings is beskikbaar gebaseer op die aanname dat die onreëlmatige komponent is wit geraas. Filter gebaseerde metodes is minder afhanklik van die stogastiese eienskappe van die tydreeks. Dit is die tyd reeks analyst8217s verantwoordelikheid om die mees geskikte filter van 'n beperkte versameling kies vir 'n spesifieke reeks. Dit is nie moontlik om streng kontrole uit te voer op die geskiktheid van die geïmpliseer model en presiese mate presisie en statistiese inferensie is nie beskikbaar nie. Daarom kan 'n vertrouensinterval nie gebou word rondom die skatting. Die volgende diagramme vergelyk die teenwoordigheid van elk van die model komponente by die seisoenale frekwensies vir die twee seisoenale aanpassing filosofieë. Die x-as is die tydperk lengte van die siklus en die y-as verteenwoordig die sterkte van die siklusse wat elke komponent bestaan ​​uit: Figuur 11: Vergelyking van die twee seisoenale aanpassing filosofieë Filter gebaseerde metodes aanvaar dat die elke komponent bestaan ​​slegs 'n sekere siklus lengtes. Hoe langer siklusse vorm die tendens, die seisoenale komponent is teenwoordig by seisoenale frekwensies en die onreëlmatige komponent word gedefinieer as siklusse van enige ander lengte. Onder 'n model wat gebaseer is filosofie, die neiging, seisoenale en onreëlmatige komponent teenwoordig is glad siklus lengtes. Die onreëlmatige komponent is van konstante krag, die seisoenale komponent pieke op seisoenale frekwensies en die tendens komponent is die sterkste in die langer siklusse. Hierdie bladsy die eerste keer gepubliseer 14 November 2005, laas 25 Julie 2008A eenvoudige en algemene metode vir die invul van ontbrekende data, as jy loop van 'n volledige data het, is om Lineêre regressie gebruik. Sê jy 1000 lopies van 5 in 'n ry met geen ontbreek. Stel die 1000 x 1 vektor y en 1000 x 4 matriks X: Regressie sal jy 4 nommers A B C D wat 'n beste wedstryd gee vir jou 1000 rye data mdash verskillende data, anders A B C D gee. Dan gebruik jy hierdie A B C D om te skat (voorspel, interpoleer) ontbreek wt0. (Vir menslike gewigte, Id verwag dat 'n b c d aan almal rondom 04/01 wees.) (Daar is Honderde boeke en artikels oor regressie, op alle vlakke. Vir die verband met interpolasie, al is, ek weet nie van 'n goeie inleiding iemand)


No comments:

Post a Comment