Wednesday, 15 November 2017

Glidande medelvärde error term


Den här frågan har redan ett svar här: För en ARIMA (0,0,1) modell förstår jag att R följer ekvationen: xt mu e (t) thetae (t-1) (Var snäll och korrigera mig om jag har fel) anta e (t-1) är samma som resten av den sista observationen. Men hur beräknas e (t) Här är de fyra första iakttagelserna i en provdata: 526 658 624 611 Dessa är parametrarna Arima (0,0,1) modell gav: intercept 246.1848 ma1 0.9893 Och det första värdet som R passar med modellen är: 327.0773 Hur får jag det andra värdet jag använde: 246.1848 (0.9893 (526-327.0773)) 442.979 Men det andra monterade värdet som ges av R är. 434.7928 Jag antar att skillnaden är på grund av e (t) termen. Men jag vet inte hur man beräknar e (t) termen. frågade 28 juli 14 kl 16:12 markerad som duplikat av Glenb 9830. Nick Stauner. whuber 9830 Jul 29 14 på 1:24 Denna fråga har blivit ombedd tidigare och har redan ett svar. Om svaren inte tar upp din fråga helt, fråga en ny fråga. Du kan få de monterade värdena som enstegsprognoser med hjälp av innovationsalgoritmen. Se till exempel proposition 5.5.2 i Brockwell och Davis downloable från internet jag hittade dessa bilder. Det är mycket lättare att få de monterade värdena som skillnaden mellan de observerade värdena och restvärdena. I detta fall kokar din fråga ner för att erhålla rester. Låt oss ta denna serie som en MA (1) - process: Resterna, hat t, kan erhållas som ett rekursivt filter: Till exempel kan vi få resten vid tidpunkten 140 som det observerade värdet vid t140 minus det beräknade medelvärdet minus hatt gånger föregående residual, t139): Funktionsfiltret kan användas för att göra dessa beräkningar: Du kan se att resultatet är mycket nära resterna returnerade av rester. Skillnaden i de första residualerna är troligen på grund av någon initialisering som jag kan ha utelämnat. De monterade värdena är bara de observerade värdena minus restvärdena: I praktiken bör du använda funktionerna residualer och monterade men för pedagogiskt ändamål kan du prova den rekursiva ekvationen som används ovan. Du kan börja med att göra några exempel för hand som visas ovan. Jag rekommenderar att du läser också dokumentationen av funktionsfiltret och jämför vissa av dina beräkningar med det. När du förstår de verksamheter som är involverade i beräkningen av rester och monterade värden kommer du att kunna göra kunnig användning av de mer praktiska funktionerna och monteras. Det kan hända att du hittar någon annan information som är relaterad till din fråga i det här inlägget. Det här är en grundläggande fråga om Box-Jenkins MA-modeller. Som jag förstår är en MA-modell i princip en linjär regression av tidsserievärden Y mot tidigare felvillkor et. e. Det vill säga att observationen Y först regresseras mot sina tidigare värden Y. Y och sedan används en eller flera Y-hat-värden som felvillkor för MA-modellen. Men hur är felvillkoren beräknade i en ARIMA-modell (0, 0, 2) Om MA-modellen används utan en autoregressiv del och därmed inget uppskattat värde, hur kan jag eventuellt få en felbegränsning frågad 7 april 12 kl 12:48 MA Model Estimation: Låt oss anta en serie med 100 tidspunkter, och säg att detta kännetecknas av MA (1) modell utan avlyssning. Sedan ges modellen av ytvarepsilont-thetavarepsilon, quad t1,2, cdots, 100quad (1) Felbegreppet här observeras inte. Så för att erhålla detta, Box et al. Tidsserieanalys: prognos och kontroll (3: e upplagan). sidan 228. föreslå att felperioden beräknas rekursivt av, så felperioden för t1 är varepsilon y thetavarepsilon Nu kan vi inte beräkna detta utan att veta värdet av theta. För att uppnå detta måste vi beräkna den ursprungliga eller preliminära beräkningen av modellen, se Box et al. av den nämnda boken, avsnitt 6.3.2 sidan 202 anger att det har visat sig att de första q autokorrelationerna av MA (q) processen är icke-zero och kan skrivas i termer av modellparametrarna som rhokdisplaystylefrac theta1theta theta2theta cdotstheta thetaq quad k1,2, cdots, q Uttrycket ovanför forrho1, rho2cdots, rhoq i termer teta1, theta2, cdots, thetaq, levererar q ekvationer i q okända. Preliminära uppskattningar av thetas kan erhållas genom att ersätta uppskattningar rk för rhok i ovanstående ekvation Observera att rk är den uppskattade autokorrelationen. Det finns mer diskussion i avsnitt 6.3 - Inledande uppskattningar för parametrarna. vänligen läs om det. Nu, förutsatt att vi får den ursprungliga uppskattningen theta0.5. Sedan, varepsilon y 0.5varepsilon Nu, ett annat problem är att vi inte har värde för varepsilon0 eftersom t börjar vid 1, och så kan vi inte beräkna varepsilon1. Lyckligtvis finns det två metoder två att få detta, villkorlig sannolikhet villkorlig sannolikhet enligt Box et al. Avsnitt 7.1.3 sidan 227. Värdena för varepsilon0 kan ersättas med noll som en approximation om n är måttlig eller stor, denna metod är villkorlig sannolikhet. I annat fall används ovillkorlig sannolikhet, varvid värdet av varepsilon0 erhålles genom back-prognos, Box et al. rekommendera den här metoden. Läs mer om back-prognos på avsnitt 7.1.4 sidan 231. Efter att ha erhållit de initiala uppskattningarna och värdet av varepsilon0, så kan vi slutligen fortsätta med rekursiv beräkning av felperioden. Då är det sista steget att uppskatta modellens parameter (1), kom ihåg det här är inte den preliminära beräkningen längre. Vid uppskattning av parametern theta använder jag icke-linjär uppskattningsprocedur, särskilt Levenberg-Marquardt-algoritmen, eftersom MA-modellerna är olinjära på parametern. A när jag frågades om jag kunde ge några exempel på situationer där fel i en regressionsmodell skulle förväntas följa en glidande medelprocess. Inledande kurser inom ekonometri diskuterar alltid situationen där fel i en modell är korrelerade, vilket innebär att den associerade kovariansmatrisen är icke-skalär. Specifikt är åtminstone några av de diagonala elementen i denna matris icke-noll. Exempel som vanligtvis nämns inkluderar: a) Felen följer en stationär första-order-autoregressiv (dvs AR (1)) - processen och (b) Felen följer ett första ordningens glidande medelvärde (dvs. MA (1)) . Typiskt behandlar diskussionen då test för oberoende mot en specifik alternativ process och estimatorer som tar hänsyn till den icke-skalära kovariansmatrisen - t ex. GLS (Aitken) estimatorn. Det är ofta lättare att motivera AR-fel än att tänka på orsakerna till att MA-fel kan uppstå i en regressionsmodell i praktiken. Om exempelvis användes ekonomiska tidsseriedata och om felperioden återspeglar utelämnade effekter, kommer de senare troligen att vara trendiga och eller cykliska. I varje fall ger detta upphov till en autoregressiv process. Uteslutandet av en säsongsvariabel kommer generellt att innebära fel som följer en AR (4) process och så vidare. Låt oss dock tänka på några situationer där MA-regressionsfel kan förväntas uppstå. Nicholls et al. (1975) ger en riktigt bra undersökning av uppskattningsproblemen i samband med MA - och ARMA-modeller. Trots sitt datum är detta dokument fortfarande mycket viktigt, och det ger också några bra exempel på varför MA-fel kan förväntas i regressionsmodeller uppskattade från ekonomiska data. (H. T. till Des. Adrian och Deane för Parzen-citatet.) Jag drar ur deras undersökning och lägger sedan till några senare exempel. För det första är det en klass av modeller som du brukade hitta diskuteras ofta i introduktionsekonometrihandböcker. Du ser dem inte så ofta dessa dagar I grund och botten innebär de att man ersätter en observerbar regressor med en viktad summa av fördröjda värden av en observerbar variabel. De klassiska exemplen brukade relatera till prisförväntningar och permanent inkomst, men det finns andra också. Heres hur det går. Antag att modellen av intresse är av formen där X t inte är observerbar, men vi tror att den kan representeras som en fördelad lagring av en observerbar variabel, X t. Om denna fördelade fördröjning är rationell kan den uttryckas som förhållandet mellan två polynomier i lagoperatören L, där L (Xt) X t-Lp (Xt) X t-p etc. Det vill säga: där A (L) och B (L) är slutgiltiga polynomier i L. säga. (Ive har bara märkt några av koefficienterna för att göra det möjligt att dela båda sidorna av ekvationen med b 0.) Vi har nu en (dynamisk) modell där alla variablerna är observerbara, men felperioden följer en MA (1 ) bearbeta. (Naturligtvis innebär förekomsten av den fördröjda beroende variabeln som regressor tillsammans med MA-felen att OLS kommer att vara både partisk och inkonsekvent och en alternativ estimator, såsom instrumentvariabler, kommer att behövas för att få konsekventa uppskattningar av parametrarna .) Praktiska exempel på sådana modeller inkluderar de där Y. X och X är varulager, faktisk försäljning och förväntad försäljning respektive där Y. X och X mäts konsumtion och inkomst och permanent inkomst. Se Sims (1974) för vidare diskussion av modeller av denna generella typ. Som ett andra exempel, överväga följande situation som uppstår i praktiken ganska ofta, särskilt när man modellerar finansiella data. Antag att dagliga data är tillgängliga, men dessa konverteras till månatliga avkastningar (log-skillnader) för modelleringsändamål. Så, en resulterande månatlig observation använder data från 1 juli till 1 augusti (säg) nästa använder data från 2 juli till 2 augusti etc. Uppgifterna överlappar i den meningen att många dagliga observationer återanvänds vid beräkningen av successiva månadsvärden. Ett vanligt exempel på detta med makroekonomiska data uppstår när vi ser att KPI-uppgifter mäts månadsvis och sedan konverteras och rapporteras i form av årliga inflationstakten.1 Rowley och Wilton (1973) och Hansen och Hodrick (1980) erkände att de arbetar med överlappande data kommer att inducera en glidande medelprocess i felperioden för en regressionsmodell. Gilbert (1986) visar hur ogiltiga slutsatser kan dras om detta inte är känt och beaktat. Mer nyligen har Harri och Brorsen (2009) gett en användbar diskussion om några av de andra ekonometriska konsekvenserna av modellering med sådan data. Som ett slutligt exempel på hur MA-fel kan uppstå i en regressionsmodell, kan vi överväga den situation där den underliggande ekonomiska modellen uttrycks i kontinuerlig tid. Naturligtvis observeras ekonomiska data endast diskret, så uppskattningen av den ekonometriska modellen innebär en typ av approximation. Theres en rik litteratur om kontinuerlig ekonometrics, som åtminstone är att fungera av Koopmans (1950). Många av de främsta bidragsgivarna till denna litteratur var förknippade med ekonomisk ekonomi i Auckland, däribland sen Rex (A. R.) Bergstrom, Cliff. (C. R.) Wymer och Peter (P. C. B.) Phillips. Peters Masters avhandling (övervakad vid Auckland av Rex Bergstrom) var på detta område, vilket resulterade i hans första Econometrica papper. Så var hans Ph. D. övervakad av Denis (J. D.) Sargan vid L. S.E. Det är också intressant att notera att Bill (A. W.) Phillips - Nya Zeelander som gav oss Phillips-kurvan - gjorde också seminal och mycket tidigt bidrag till kontinuerlig ekonometri. Exempel på hans bidrag till det här området är Phillips (1956, 1966). Nu, hur hänför sig detta till problemet med fel som följer en MA-process Tja, i ett nötskal, om modellen skrivs i kontinuerlig tid, men innehåller flödesdata som måste mätas diskret, då kommer felets fel att följ en MA (1) process. Du kan hitta en riktigt bra diskussion om detta i Phillips (1978). Intressant, estimatorer som använder denna diskreta approximation är förspända och biasen försvinner inte när provtagningsintervallet går till noll - men det är en annan historia. Där har vi några exempel på hur MA-fel kan uppstå i regressionsmodeller som beräknas med ekonomiska data. Jag föreslår inte att denna lista är omfattande, men förhoppningsvis kommer den att fungera för att illustrera att sådana fel kan uppstå av ett ganska varierat antal anledningar. Det är viktigt att hålla detta i åtanke, och att testa för denna typ av modellspecifik specifikation. Obs! Länkarna till följande referenser är bara till hjälp om din dators IP-adress ger dig tillgång till de elektroniska versionerna av aktuella publikationer. Det är därför som en skriftlig referensdel tillhandahålls. Gilbert, C. L. (1986). Testa den effektiva marknadshypotesen på medeltal. Applied Economics 18, 1149-1166. Hansen, L. P. och R. J. Hodrick (1980). Valutakurser som optimala förutsägare för framtida spoträntor: En ekonometrisk analys. Journal of Political Economy. 88, 829-853. Harri, A. och B. W. Brorsen (2009). Det överlappande dataproblemet. Kvantitativ och kvalitativ analys i samhällsvetenskap. 3 (3), 78-115. Koopmans, T. C. (1950). Modeller med kontinuerlig tidsvariabel. I T. C. Koopmans, red. Statistisk inferens i dynamiska ekonomiska modeller. New York, Wiley. McCrorie, J. R. och M. J. Chambers (2006). Granger orsakssamband och provtagning av ekonomiska processer. Journal of Econometrics. 132, 311-336. Nicholls, D. F. A. R. Pagan och R. D. Terrell (1975). Uppskattningen och användningen av modeller med rörliga genomsnittliga störningsvillkor: En undersökning. Internationella ekonomiska granskningen 16, 113-134. Phillips, A. W. (1956). Några anteckningar om uppskattning av tidsformer i reaktioner i ömsesidiga dynamiska system. Economica. 23, 99-113. Phillips, A. W. (1966). Uppskattning av system med skillnadsekvationer med rörliga medelstörningar. Papper som presenterades vid Econometric Society Meeting, San Francisco. Återtryckt som kapitel 11 i A. R. Bergstrom, A. J.L. Catt och M. Preston, eds. Stabilitet och inflation: En uppsättning volymer för att hedra minnet av A. W.H. Phillips. New York, Wiley. Phillips, P. C. B. (1972). Den strukturella uppskattningen av ett stokastiskt differentialekvationssystem. E conometrica. 40, 1021-1041. Phillips, P. C. B. (1978). Behandlingen av flödesdata vid uppskattningen av kontinuerliga tidssystem, i A. R. Bergstrom, A. J.L. Catt och M. Preston, eds. Stabilitet och inflation: En uppsättning volymer för att hedra minnet av A. W.H. Phillips. New York, Wiley, 2578211274. Rowley, J. C.R. och D. A. Wilton (1973). Kvartalsvisa lönebestämmelser: Några nya effektiva uppskattningar. Amerikanska ekonomiska granskningen 63, 380-389. Sims, C. A. (1974). Distribuerade lager. I: M. D. Intriligator och D. A. Kendrick, eds. Gränser för kvantitativ ekonomi, vol. 2. Nord-Holland, Eftersom det här inlägget och de senaste veckans eller så vidare MLEs och invariance visar starkt, är detta en av de bästa bloggarna på webben för statistisk inlärning. Det tar tillbaka minnet om många saker som glömts efter quals och lägger till ytterligare innehåll. De klara prosa och tydliga exemplen gör inte heller ont :-). Tack så mycket Ben: Tack för den typiska feedbacken. Jag tycker om att blogga mycket, så det är trevligt att veta att det träffar platsen då och då (förslagstänkanden välkomnas alltid.) Det är en väldigt bra blogg med en experimentell touch som hjälper till att hänvisa, blick, se över begreppen och dess enorma hjälp för alla som vill minnas ekonometri under en sida och det med koder och data för lärandesätt. Tack så mycket för att dela med oss.8.4 Flytta genomsnittsmodeller I stället för att använda tidigare värden för prognosvariabeln i en regression använder en glidande genomsnittsmodell tidigare prognosfel i en regressionsliknande modell. y c et theta e theta e dots theta e, där et är vitt brus. Vi hänvisar till detta som en MA (q) modell. Naturligtvis observerar vi inte värdena på et, så det är inte riktigt regression i vanligt bemärkande. Observera att varje värde av yt kan betraktas som ett viktat glidande medelvärde av de senaste prognosfelen. Rörliga genomsnittsmodeller ska emellertid inte förväxlas med glidande medelutjämning som vi diskuterade i kapitel 6. En rörlig genomsnittsmodell används för att prognosera framtida värden medan den genomsnittliga utjämningen används för att uppskatta trendvärdet för tidigare värden. Figur 8.6: Två exempel på data från rörliga genomsnittsmodeller med olika parametrar. Vänster: MA (1) med y t 20e t 0.8e t-1. Höger: MA (2) med y t e t-e t-1 0.8e t-2. I båda fallen distribueras e t normalt vitt brus med medel noll och varians en. Figur 8.6 visar vissa data från en MA (1) modell och en MA (2) modell. Ändring av parametrarna theta1, prickar, thetaq resulterar i olika tidsseriemönster. Liksom med autoregressiva modeller ändrar variansen av felet termen enbart seriens skala, inte mönstren. Det är möjligt att skriva en stationär AR (p) modell som en MA (infty) modell. Genom att använda upprepad substitution kan vi visa detta för en AR (1) - modell: begin yt amp phy1y et amp phi1 (phi1y e) et amp phy12y phi1e et amp phy13y phi1e phi1e et amptext end Provmed -1 lt phi1 lt 1, värdet av phi1k blir mindre eftersom k blir större. Så småningom uppnår vi yt och phi1 phi12 e phi13 e cdots, en MA (infty) - process. Det omvända resultatet hålls om vi lägger några begränsningar på MA parametrarna. Då kallas MA-modellen inverterbar. Det vill säga att vi kan skriva någon inverterbar MA (q) process som en AR (infty) - process. Omvändbara modeller är inte bara för att vi ska kunna konvertera från MA-modeller till AR-modeller. De har också vissa matematiska egenskaper som gör dem enklare att använda i praktiken. Invertibilitetsbegränsningarna liknar stationaritetsbegränsningarna. För en MA (1) modell: -1lttheta1lt1. För en MA (2) modell: -1lttheta2lt1, theta2theta1 gt-1, theta1-teteta1 1. Mer komplicerade förhållanden håller för qge3. Igen kommer R att ta hand om dessa hinder vid beräkning av modellerna.

No comments:

Post a Comment