Saturday 18 November 2017

Generere Bevegelse Gjennomsnittet Stata


Denne datastrukturen er ganske uegnet til formål. Hvis du antar et ID-nummer, må du omforme. f. eks Deretter er et glidende gjennomsnitt lett. Bruk tssmooth eller bare generer. f. eks Mer om hvorfor datastrukturen din er ganske uegnet: Ikke bare ville beregning av et bevegelige gjennomsnitt trenge en sløyfe (ikke nødvendigvis involverende egen), men du ville opprette flere nye ekstravariabler. Å bruke dem i en hvilken som helst etterfølgende analyse ville være et sted mellom vanskelig og umulig. EDIT Ill gir en prøvesløp, mens du ikke beveger deg fra min holdning at det er dårlig teknikk. Jeg ser ikke en grunn bak navnetavtalen, der P1947 er et middel for 1943-1945. Jeg antar det er bare en skrivefeil. La oss anta at vi har data for 1913-2012. For 3 år mister vi ett år i hver ende. Det kan skrives mer kortfattet, på bekostning av en flurry av makroer i makroer. Bruk av ujevne vekter er enkelt, som ovenfor. Den eneste grunnen til å bruke egen er at den ikke gir opp hvis det er feil, noe som ovenfor vil gjøre. Som et spørsmål om fullstendighet, legg merke til at det er enkelt å håndtere avganger uten å ty til egen. og nevnen Hvis alle verdier mangler, reduseres dette til 00, eller mangler. Ellers, hvis noen verdi mangler, legger vi 0 til telleren og 0 til nevnen, som er den samme som å ignorere den. Naturligvis er koden tålelig som ovenfor i gjennomsnitt på 3 år, men enten for det tilfellet eller i gjennomsnitt over flere år, ville vi erstatte linjene over ved en sløyfe, hvilket er det som gjør. Stata: Dataanalyse og statistisk programvare Nicholas J Cox, Durham University, Storbritannia Christopher Baum, Boston College egen, ma () og dens begrensninger Statarsquos mest åpenbare kommando for å beregne glidende gjennomsnitt er ma () funksjonen til egen. Gitt et uttrykk, skaper det et periode-glidende gjennomsnitt av det uttrykket. Som standard er tatt som 3. må være merkelig. Men som den manuelle oppføringen indikerer, kan egen, ma () kanskje ikke kombineres med av varlist:. og av den grunn alene, det er ikke aktuelt for paneldata. I alle fall står den utenfor settet med kommandoer som er spesifikt skrevet for tidsserier, se tidsserier for detaljer. Alternative tilnærminger For å beregne bevegelige gjennomsnitt for paneldata er det minst to valg. Begge avhenger av at datasettet har vært forhåndssettet. Dette er veldig verdt å gjøre: Ikke bare kan du spare deg selv gjentatte ganger med å angi panelvariabel og tidsvariabel, men Stata oppfører seg smart gitt gaps i dataene. 1. Skriv din egen definisjon ved å bruke generering Bruke tidsserier operatører som L. og F.. Gi definisjonen av det bevegelige gjennomsnittet som argumentet til en generasjonserklæring. Hvis du gjør dette, er du selvsagt ikke begrenset til likevektede (uveide) sentrert glidende gjennomsnitt beregnet av egen ma (). For eksempel vil likeveide tre-glidende gjennomsnitt bli gitt av og noen vekt kan enkelt angis: Du kan selvsagt spesifisere et uttrykk som logg (myvar) i stedet for et variabelt navn som myvar. En stor fordel ved denne tilnærmingen er at Stata automatisk gjør det riktige for paneldata: ledende og lagre verdier utarbeides i paneler, akkurat som logikken dikterer de burde være. Den mest bemerkelsesverdige ulempen er at kommandolinjen kan bli ganske lang hvis det bevegelige gjennomsnittet innebærer flere termer. Et annet eksempel er et ensidig glidende gjennomsnitt basert bare på tidligere verdier. Dette kan være nyttig for å generere en adaptiv forventning om hva en variabel vil være basert på på hidtidig informasjon: hva kan noen prognose for den nåværende perioden basert på de siste fire verdiene, ved hjelp av en fast vekting ordning (en 4-periode forsinkelse kan være spesielt brukt i kvartalsvisserier.) 2. Bruk egen, filter () fra SSC Bruk det brukerskrevne egenfunksjonsfilteret () fra egenmore-pakken på SSC. I Stata 7 (oppdatert etter 14. november 2001), kan du installere denne pakken, hvorefter hjelpemore peker på detaljer på filteret (). De to eksemplene ovenfor ville bli gjengitt (I denne sammenhengen er generasjonsmetoden kanskje mer gjennomsiktig, men vi vil se et eksempel på det motsatte i et øyeblikk.) Lags er en numlist. fører til å være negativ lags: i dette tilfellet utvider -11 til -1 0 1 eller led 1, lag 0, lag 1. Koef-ficientene, en annen numlist, multipliserer tilsvarende lags eller ledende elementer: i dette tilfellet er disse elementene F1.myvar . myvar og L1.myvar. Effekten av normaliseringsalternativet er å skalere hver koeffisient med summen av koeffisientene slik at koeffisienten (1 1 1) normaliserer er ekvivalent med koeffisientene 13 13 13 og coef (1 2 1) normaliserer tilsvarer koeffisienter på 14 12 14 Du må spesifisere ikke bare lagene, men også koeffisientene. Fordi egen, ma () gir like vektet tilfelle, er hovedgrunnlaget for egen, filter () å støtte det ulikt vektede tilfellet, som du må spesifisere koeffisienter for. Det kan også sies at å forplikte brukerne til å spesifisere koeffisienter er et lite ekstra trykk på dem for å tenke på hvilke koeffisienter de vil ha. Hovedgrunnlaget for likevekter er, vi antar, enkelhet, men likevekt har elendige frekvensdomene egenskaper, for å nevne bare en vurdering. Det tredje eksemplet ovenfor kan enten være omtrent like komplisert som genereringsmetoden. Det er tilfeller der eget, filter () gir en enklere formulering enn å generere. Hvis du vil ha et ni-termisk binomialfilter, som klimatologene finner nyttige, ser det ut som om det er mindre fryktelig enn, og lettere å få riktig enn, akkurat som med genereringsmetoden, fungerer egen, filter () riktig med paneldata. Faktisk, som angitt ovenfor, avhenger det av at datasettet har blitt tsset på forhånd. Et grafisk tips Når du har beregnet dine bevegelige gjennomsnitt, vil du sannsynligvis se på en graf. Den brukerskrevne kommandoen tsgraph er smart om tsset datasett. Installer den i en oppdatert Stata 7 av ssc inst tsgraph. Hva med å skille med hvis Ingen av de ovennevnte eksemplene benytter seg av restriksjoner. Faktisk egen, ma () vil ikke tillate om å bli spesifisert. Noen ganger vil folk bruke hvis man beregner glidende gjennomsnitt, men bruken er litt mer komplisert enn det vanligvis er. Hva ville du forvente av et glidende gjennomsnitt beregnet med hvis. La oss identifisere to muligheter: Svak tolkning: Jeg vil ikke se noen resultater for de ekskluderte observasjonene. Sterk tolkning: Jeg vil ikke engang at du skal bruke verdiene for de ekskluderte observasjonene. Her er et konkret eksempel. Anta som en konsekvens av noen om tilstand, observasjoner 1-42 er inkludert, men ikke observasjoner 43 på. Men det bevegelige gjennomsnittet for 42 vil blant annet avhenge av verdien for observasjon 43 dersom gjennomsnittet strekker seg bakover og fremover og har en lengde på minst 3, og det vil på samme måte avhenge av noen av observasjonene 44 og videre under noen omstendigheter. Vårt gjetning er at de fleste ville gå for den svake tolkningen, men om det er riktig, støtter filter () ikke heller. Du kan alltid ignorere hva du donrsquot vil ha eller til og med sette uønskede verdier til å mangle etterpå ved å bruke erstatte. Et notat om manglende resultater i ender av serier Fordi glidende gjennomsnitt er funksjoner av lags og leads, produserer egen, ma () mangler hvor lags og ledninger ikke eksisterer, i begynnelsen og slutten av serien. Et alternativ nomiss styrker beregningen av kortere, ukjente glidende gjennomsnitt for haler. I motsetning, genererer heller ikke eget, filter () gjør, eller tillater, noe spesielt for å unngå å savne resultater. Hvis noen av verdiene som trengs for beregning mangler, mangler det resultatet. Det er opp til brukerne å avgjøre om og hvilken korrigerende kirurgi som kreves for slike observasjoner, antagelig etter å ha sett på datasettet og tatt i betraktning enhver underliggende vitenskap som kan bli båret. MOVAVG: Stata-modul ved å bruke Mata til å generere bevegelige gjennomsnitt Når du ber om en korreksjon , vær oppmerksom på at disse elementene håndterer: RePEc: boc: bocode: s457476. Se generell informasjon om hvordan du retter materiale i RePEc. For tekniske spørsmål angående dette elementet, eller for å rette opp forfatterens, tittel, abstrakt, bibliografisk eller nedlastingsinformasjon, kontakt: (Christopher F Baum) Hvis du har skrevet dette produktet og ennå ikke er registrert hos RePEc, oppfordrer vi deg til å gjøre det her . Dette gjør det mulig å koble profilen din til dette elementet. Det tillater deg også å akseptere potensielle sitater til dette elementet som vi er usikre på. Hvis referanser mangler helt, kan du legge til dem ved hjelp av dette skjemaet. Hvis de fulle referansene viser et element som er til stede i RePEc, men systemet ikke lenker til det, kan du hjelpe med dette skjemaet. Hvis du vet om manglende elementer som citerer denne, kan du hjelpe oss med å opprette disse linkene ved å legge til de relevante referansene på samme måte som ovenfor, for hvert referanseelement. Hvis du er en registrert forfatter av dette elementet, kan du også sjekke tittelfanen i profilen din, da det kan være noen henvisninger som venter på bekreftelse. Vær oppmerksom på at rettelser kan ta noen uker å filtrere gjennom de ulike RePEc-tjenestene. Flere tjenester Følg serier, tidsskrifter, forfattere mer Ny nyhetsbrev via e-post Abonner på nye tilføyelser til RePEc Forfatterregistrering Offentlige profiler for økonomiforskere Forskjellige forskningsrangeringer i økonomi-relaterte felt Hvem var student av hvem ved hjelp av RePEc RePEc Biblio Curated articles amp papirer på ulike økonomi-emner Last opp papiret ditt for å bli oppført på RePEc og IDEAS EconAcademics Bloggaggregat for økonomiforskning Plagiering Sager av plagiering i økonomi Arbeidsmarkedspapirer RePEc arbeidspapirserier dedikert til arbeidsmarkedet Fantasy League Låt deg være i roret av en økonomi avdelingen Tjenester fra StL Fed Data, forskning, apps amp mer fra St. Louis FedOften ganger kan vi være interessert i å generere et romlig bevegelige gjennomsnitt av en karakteristisk X. Vi kan bruke dette glidende gjennomsnittet for å bidra til å kontrollere for heterogenitet i befolkningen som kan være relatert til romlig fordeling av observasjoner. For å gjøre det må vi ha en metode for å generere et romlig middel. Jeg kodes dette manuelt fordi jeg ikke har erfaring med romdata i Stata og vet ikke hva den innebygde kommandoen er (antar at det er en). Hvis du bare leter etter det romlige gjennomsnittet, kan du favorisere den innebygde kommandoen. Imidlertid er denne metoden fleksibel og lett modifiserbar hvis du for eksempel vil bruke tiltak utover Euclidean 2D avstandsformelen og i stedet foretrekker 3D-formelen eller nD-formelen virkelig. På samme måte kan det være lett å flytte gjennomsnittlig statistikk erstattet av flytende varians eller annen statistikk som kunne genereres via egen kommando. Dermed kan denne øvelsen være nyttig å undersøke, selv om det er overflødig. global Nobs 1000 klart sett obs Nobs Generer 2D koordinater gen latt runiform () 100 gen longg runiform () 100 Generer variabelen av interesse. Variabelen vil ha en tilfeldig komponent og en romlig avhengig komponent. gen X (lattlongg) 100rnormal () to (scatter latt X) (scatter longg X) Vi kan se at selv om det er en generell trend til større verdier som lengdegrad eller breddegrad økning, er det vanskelig å identifisere et sterkt mønster. Nå kan vi beregne det glidende gjennomsnittet for X for hver observasjon. (Det er sannsynligvis en kommando for dette som jeg ikke vet). gen Xave. gen dist. forv i1Nobs Beregn avstanden til alle punkter fra obs jeg erstatter dist (latt-latti) 2 (longg-longgi) 2) .5 Beregn gjennomsnittet av X hvis avstanden ligger innenfor intervallet av interesse egen tempxmiddel (X) hvis distltmeanrange erstatt Xave tempx hvis ni slipper tempx to (scatter latt Xave) (scatter longg Xave) Nå ser vi på det bevegelige gjennomsnittet vi kan enkelt visuelt identifisere effekten av plassering på den forventede verdien av X.

No comments:

Post a Comment