Monday 20 November 2017

Stata Generate Mobile Media Variabile


Questa struttura di dati è piuttosto inadatta allo scopo. Assumendo un id identificativo è necessario rimodellare. per esempio. Poi una media mobile è facile. Utilizzare tssmooth o semplicemente generare. per esempio. Più sul perché la struttura dei dati è del tutto inadatto: Non solo il calcolo di una media mobile hanno bisogno di un ciclo (che non prevedono necessariamente Egen), ma sarebbe la creazione di diverse nuove variabili aggiuntive. Utilizzando quelli in qualsiasi analisi successiva sarebbe da qualche parte tra scomodo e impossibile. EDIT Ill dare un loop del campione, mentre non si muove dalla mia presa di posizione che è la tecnica povera. Non vedo una ragione dietro la convenzione di denominazione per cui P1947 è un mezzo per 1943-1945 presumo questo è solo un errore di battitura. Consente di supporre che abbiamo i dati per il 1913-2012. Per mezzo di 3 anni, si perde un anno presso ogni estremità. Questo potrebbe essere scritto in modo più conciso, a scapito di una raffica di macro all'interno di macro. Utilizzando pesi disuguali è facile, come sopra. L'unica ragione per usare egen è che si pretende molto rinunciare se ci sono mancanze, che quanto sopra farà. Come una questione di completezza, si noti che è facile da gestire missings senza ricorrere a Egen. e il denominatore Se tutti i valori sono mancanti, questo si riduce a 00, o mancante. Altrimenti, se un valore è mancante, si aggiunge 0 al numeratore e al denominatore 0, che è la stessa di ignorarlo. Naturalmente il codice è tollerabile come sopra per le medie di 3 anni, ma sia per quel caso o per una media su più anni, si dovrebbe sostituire le linee sopra da un loop, che è ciò che egen does. Stata: Analisi dei dati e statistica Software Nicholas J il comando più evidente. Cox, Durham University, UK Christopher Baum, Boston college Egen, ma () e le sue limitazioni Statarsquos per calcolare medie mobili è la funzione ma () di Egen. Data un'espressione, crea una media - periodo movimento di tale espressione. Per impostazione predefinita, viene preso come 3. deve essere dispari. Tuttavia, come l'inserimento manuale indica, Egen, ma () non può essere combinata con by-variabili:. e, per questo motivo, non è applicabile ai dati panel. In ogni caso, si erge al di fuori del set di comandi appositamente scritte per le serie temporali vedi serie storiche per i dettagli. approcci alternativi per calcolare le medie per i dati panel in movimento, ci sono almeno due scelte. Entrambi dipendono l'insieme di dati essendo stato tsset in anticipo. Questo è molto vale la pena di fare: non solo è possibile risparmiare più volte specificando variabile variabile e l'ora del pannello, ma si comporta in modo Stata elegantemente dato eventuali lacune nei dati. 1. Scrivi la tua definizione utilizzando generare Uso degli operatori di serie temporali, come L. e F.. dare la definizione della media mobile come argomento di una dichiarazione di generare. Se si esegue questa operazione, si sta, naturalmente, non limitato alla altrettanto ponderate (non ponderata) centrato medie calcolate da Egen in movimento, ma (). Ad esempio, ugualmente ponderato tre periodo medie mobili sarebbe dato da alcuni pesi e possono essere facilmente specificati: È possibile, ovviamente, specificare un'espressione come log (myvar) al posto di un nome di variabile, come myvar. Un grande vantaggio di questo approccio è che Stata fa automaticamente la cosa giusta per i dati panel: ingresso e uscita valori vengono elaborati all'interno di pannelli, così come la logica impone che dovrebbero essere. Lo svantaggio più evidente è che la linea di comando può ottenere piuttosto lungo se la media mobile coinvolge diversi termini. Un altro esempio è una media mobile unilaterale basata solo su valori precedenti. Questo potrebbe essere utile per generare un'aspettativa di adattamento di quello che una variabile sarà basato esclusivamente su informazioni aggiornate: ciò che qualcuno potrebbe prevedere per l'esercizio in corso sulla base degli ultimi quattro valori, utilizzando uno schema fisso di ponderazione (un ritardo di 4 periodo potrebbe essere soprattutto comunemente usato con timeseries trimestrali.) 2. Usare Egen, filtro () da SSC utilizzare il filtro funzione di egen scritto dall'utente () dal pacchetto egenmore su SSC. In Stata 7 (aggiornato dopo il 14 novembre 2001), è possibile installare questo pacchetto dopo che aiutano punti egenmore ai dettagli del filtro (). I due esempi sopra sarebbe resa (In questo confronto la generano approccio è forse più trasparente, ma vedremo un esempio del contrario in un attimo.) I ritardi sono un numlist. conduce essendo GAL negativi: in questo caso -11 espande a -1 0 1 o portare 1, lag 0, in ritardo 1. I ficients COEF, un'altra numlist, moltiplicare i corrispondenti elementi in ritardo di sviluppo o di leader: in questo caso, tali elementi sono F1.myvar . MyVar e L1.myvar. L'effetto dell'opzione normalizzare è in scala ogni coefficiente per la somma dei coefficienti in modo che coef (1 1 1) normalizzare equivale a coefficienti di 13 13 13 e coef (1 2 1) normalizzare equivale a coefficienti di 14 12 14 . È necessario specificare non solo i ritardi, ma anche i coefficienti. Perché Egen, ma () prevede il caso altrettanto ponderata, la motivazione principale per Egen, filtro () è quello di sostenere il caso ineguale ponderata, per i quali è necessario specificare coefficienti. Si potrebbe anche dire che obbliga gli utenti di specificare coefficienti è un po 'di pressione in più su di loro per pensare a quello coefficienti che vogliono. La giustificazione principale per pesi uguali è, immaginiamo, la semplicità, ma pesi uguali avere pessime proprietà del dominio della frequenza, per citare solo una considerazione. Il terzo esempio di cui sopra potrebbe essere uno dei quali è quasi complicato come l'approccio di generare. Ci sono casi in cui Egen, filtro () fornisce una formulazione più semplice di generare. Se si desidera un filtro binomiale di nove termine, che i climatologi trovano utile, poi guarda forse meno orribile di, e più facile da ottenere rispetto, proprio come con il generare approccio, Egen, filtro () funziona correttamente con dati panel. Infatti, come già detto, esso dipende il set di dati essendo stato tsset anticipo. Un consiglio grafica Dopo aver calcolato i tuoi medie mobili, probabilmente voler guardare un grafico. Il comando tsgraph scritto dall'utente è intelligente su set di dati tsset. Installarlo in un up-to-date Stata 7 da SSC tsgraph Inst. Che dire sottoinsiemi con se nessuno dei precedenti esempi fanno uso di se restrizioni. Infatti Egen, ma () non permetterà, se da specificare. Di tanto in tanto la gente vuole usare se il calcolo medie mobili, ma il suo uso è un po 'più complicato di quanto non sia di solito. Che cosa ci si può aspettare da una media mobile calcolata con se. Cerchiamo di identificare due possibilità: l'interpretazione debole: non voglio vedere nessun risultato per le osservazioni esclusi. Forte interpretazione: io non neanche voglia di utilizzare i valori per le osservazioni esclusi. Ecco un esempio concreto. Supponiamo come conseguenza di una condizione if, osservazioni 1-42 sono inclusi ma non osservazioni 43 su. Ma la media mobile per 42 dipenderà, tra l'altro, sul valore per l'osservazione 43 se la media estende avanti e indietro ed è di lunghezza almeno 3, e sarà simile dipenderà alcune osservazioni 44 in poi in alcune circostanze. La nostra ipotesi è che la maggior parte delle persone sarebbe andare per l'interpretazione deboli, ma se questo è corretto, Egen, filtro () non supporta se uno dei due. È sempre possibile ignorare ciò che si vuole donrsquot o anche impostare valori indesiderati a mancare in seguito utilizzando sostituire. Una nota sui risultati alle estremità della serie mancante Perché medie mobili sono funzioni di ritardi e conduce, egen, MA () produce mancante in cui non esistono i ritardi e conduce, all'inizio e alla fine della serie. Un'opzione nomiss costringe il calcolo delle più brevi, medie mobili non centrati per le code. Al contrario, né generare nè Egen, filtro () lo fa, o consente, nulla di speciale per evitare risultati mancanti. Se uno dei valori necessari per il calcolo è mancante, quindi questo risultato è mancante. Spetta agli utenti di decidere se e quanto la chirurgia correttiva è richiesto per queste osservazioni, presumibilmente dopo aver guardato il set di dati e considerando ogni scienza di base che può essere portato a bear. Announcement 15 Agosto 2015, 00:13 E 'difficile mettere questo problema specifico in un paio di linee, quindi per favore portare con me quando spiego che cosa esattamente che voglio e quello che ho provato. Ho una serie di dati di sezione che ha una variabile di distretti (nomi e nomi codificati), cento minoranza etnica, e un indice di benessere di questa minoranza, tra le altre variabili. Vorrei creare un grafico a dispersione con cento minoranza etnica sul l'asse X e l'indice sulla Y per vedere come l'indice cambia all'aumentare di minoranza per cento. Inoltre, voglio creare una linea che dovrebbe contenere le medie in tutta distretti per ogni valore percentuale dell'intera popolazione di minoranza, vale a dire la media di tutti i distretti per la popolazione 0-1 minoranza, 1-2, ecc ho generato una nuova variabile con: (. 0,1,2 100) Egen newvarcut (oldvar), a e poi usato questo newvar per generare indice medio per ciascun anno: BySort newvar: Egen (meanindex) media (oldindex) Tuttavia, quando aggiungo quotline meanindex oldvarquot ottengo una tendenza media che è frastagliata (i dati sono ordinati per oldvar). Voglio lisciare fuori e generare una media mobile di valori di indice medio di tutti, dire di popolazione il 5 per cento di minoranza (2 GAL, 2 cavi, nonché l'osservazione per cento). Ho provato tssmooth mA, ma avrei dovuto dichiarare il mio set di dati di una serie temporale uno. Non avrebbe accettato oldvar come una variabile tempo a lamentarsi che non ci sono quotrepeated valori di tempo a campione, r (451) quot. Se aggiungo quartiere come una variabile pannello di forzare un unico punto di tempo per ogni pannello, tssmooth continuerà a non funzionare dicendo che quotwindow) non validi (- numlist invalido ha elementi al di fuori del range ammesso, r (125) quot Ho provato diversi parametri della finestra con lo stesso risultato. Ho provato manualmente per ricodificare i dati per mantenere una sola osservazione di meanindex per ogni intero per cento della popolazione di minoranza, ma tssmooth ma vorrei tornare lo stesso errore. Credo che finché ho solo singola osservazione di ogni distretto per la variabile quottimequot di minoranza, tssmooth (o equivalente manuale) non funzionerà. L'unico modo che posso creare questa media mobile è se continuo solo le osservazioni con una osservazione meanindex per ogni intero per cento riducendo così il set di dati per contenere solo valori medi, uno per tutta la percentuale della popolazione di minoranza. Ma poi non riesco a creare un grafico a dispersione con i distretti attuali perché non sono nel set di dati più a lungo. Ho provato di tutto mi viene in mente, ma nulla sembra funzionare. Eppure, la questione di aggiungere un tendenza media lisciata attraverso asse x dovrebbe essere abbastanza banale. Gradirei qualche consiglio su questo tema. Ultima modifica di Mikhail Balaev 15 agosto, 2015, 0:19.

No comments:

Post a Comment