Logit E Probit Modello In Forex Stata


AVVISO: Il gruppo di consulenza Idre statistica sarà la migrazione del sito web per il CMS WordPress nel mese di febbraio per facilitare la manutenzione e la creazione di nuovi contenuti. Alcune delle nostre pagine più vecchie verranno rimossi o archiviati in modo tale che essi non saranno più mantenuti. Cercheremo di mantenere i reindirizzamenti in modo che i vecchi URL continueranno a lavorare nel miglior modo possibile. Benvenuti al Istituto per la ricerca e l'istruzione digitale Aiuto Consulting Group Stat, dando un regalo Esempi Stata analisi dei dati informazioni regressione logistica Versione: Codice per questa pagina è stato testato in Stata 12. La regressione logistica, chiamato anche un modello logit, viene utilizzato per il modello variabili di outcome dicotomica. Nel modello logit le probabilità di registro l'esito è modellato come una combinazione lineare delle variabili predittive. Si prega di notare: Lo scopo di questa pagina è quello di mostrare come utilizzare i vari comandi di analisi dei dati. Esso non copre tutti gli aspetti del processo di ricerca, che sono tenuti ai ricercatori di fare. In particolare, non copre la pulizia dei dati e il controllo, la verifica di ipotesi, la diagnostica modello e potenziali analisi di follow-up. Esempi di regressione logistica Esempio 1: Supponiamo che ci interessa i fattori che influenzano se un candidato politico vince le elezioni. La variabile di outcome (risposta) è binario (01) vincere o perdere. Le variabili predittive di interesse sono la quantità di denaro speso per la campagna, la quantità di tempo speso una campagna negativa e se il candidato è una carica o meno. Esempio 2: Un ricercatore è interessato a come variabili, come GRE (Graduate Record punteggi d'esame), GPA (media dei voti) e il prestigio dell'istituto universitario, effetto ammissione scuola di specializzazione. La variabile di risposta, admitdont ammettere, è una variabile binaria. Descrizione dei dati per la nostra analisi dei dati di seguito, ci accingiamo a espandere Esempio 2 di rimettersi in scuola di specializzazione. Abbiamo generato i dati ipotetici, che possono essere ottenuti dal nostro sito. Questo insieme di dati ha una risposta binaria (esito, dipendente) variabile chiamata ammettere. Ci sono tre variabili predittive: gre. GPA e rango. Tratteremo il GRE variabili e GPA come continuo. Il rango variabile assume i valori da 1 a 4. Le istituzioni con un rango di 1 hanno il più alto prestigio, mentre quelli con un grado di 4 hanno il più basso. Metodi di analisi si potrebbe considerare Ecco un elenco di alcuni metodi di analisi si può avere incontrato. Alcuni dei metodi elencati sono abbastanza ragionevoli, mentre altri hanno uno caduto in disgrazia o hanno limitazioni. La regressione logistica, il focus di questa pagina. Probit regressione. Analisi probit produrrà risultati simili regressione logistica. La scelta di probit contro logit dipende in gran parte le preferenze individuali. OLS la regressione. Quando utilizzato con una variabile risposta binaria, questo modello è noto come un modello lineare di probabilità e può essere usato come un modo per descrivere probabilità condizionali. Tuttavia, gli errori (cioè residui) dal modello di probabilità lineare violano la omoschedasticità e la normalità di errori ipotesi di regressione OLS, con conseguente errori standard validi e test di ipotesi. Per una discussione più approfondita di questi ed altri problemi con il modello di probabilità lineare vedere lungo (1997, p. 38-40). Due-gruppo di analisi discriminante. Metodo multivariata per le variabili di outcome dicotomiche. Hotellings T 2. Il 01 risultato viene trasformato in variabile di raggruppamento, e gli ex predittori si trasformano in variabili di risultato. Ciò produrrà un test generale di significatività, ma non darà singoli coefficienti per ciascuna variabile, e non è chiaro in che misura ciascun quotpredictorquot viene regolata per l'impatto degli altri regressione logistica quotpredictors. quot seguito usiamo il comando logit di stimare una modello di regressione logistica. L'i. prima posizione indica che rango è una variabile fattore (cioè variabile categorica), e che dovrebbe essere inclusa nel modello come una serie di variabili indicatore. Si noti che questa sintassi è stata introdotta nel Stata 11. In uscita sopra, per prima cosa vedere il registro di iterazione, che indica quanto velocemente il modello convergente. La probabilità log (-229,25875) può essere utilizzato nei confronti di modelli annidati, ma trovarmici mostrano un esempio di quello qui. Anche nella parte superiore dell'uscita vediamo che tutte le 400 osservazioni nostri dati impostati sono stati utilizzati nell'analisi (meno osservazioni sarebbero stati utilizzati se qualcuno dei nostri variabili avevano valori mancanti). Il rapporto di verosimiglianza chi-quadrato di 41.46 con un p-value di 0.0001 ci dice che il nostro modello nel suo complesso si adatta molto meglio di un modello vuoto (cioè un modello senza predittori). Nella tabella vediamo i coefficienti, i loro errori standard, la Z-statistica, associata p-value, e l'intervallo di confidenza 95 dei coefficienti. Sia gre e GPA sono statisticamente significativi, come lo sono le tre variabili indicatore di rango. I coefficienti di regressione logistica danno la variazione dei log odds dell'esito di un incremento unitario di variabile predittore. Per ogni variazione unitaria in gre. le probabilità di registro di ammissione (contro non ammissione) aumenta di 0.002. Per un incremento unitario di GPA. le probabilità di registro di essere ammesso alla laurea aumenta scuola per 0.804. Le variabili indicatore di rango hanno un'interpretazione leggermente diversa. Ad esempio, dopo aver frequentato un istituto universitario con rango di 2, rispetto a un istituto con un rango di 1, diminuisce le probabilità di log di ammissione per 0.675. Siamo in grado di testare per un effetto complessivo di rango con il comando di prova. Di seguito si vede che l'effetto complessivo di rango è statisticamente significativa. Possiamo anche testare ulteriori ipotesi circa le differenze tra i coefficienti per i diversi livelli di rango. Qui di seguito ci prova che il coefficiente di rango 2 è pari al coefficiente di rango 3. (Si noti che se volevamo valutare questa differenza, potremmo farlo utilizzando il comando Lincom.) È inoltre possibile exponentiate i coefficienti e interpretarli come probabilità - ratios. Stata farà questo calcolo per voi, se si utilizza l'opzione di o, illustrato di seguito. Si potrebbe anche usare il comando logistico. Ora possiamo dire che per un aumento di una unità di GPA. le probabilità di essere ammessi a scuola (contro non essere ammessi) aumentano di un fattore di 2,23. Per ulteriori informazioni sulle probabilità di interpretazione rapporti di vedere la nostra pagina FAQ Come si interpretano odds ratio di regressione logistica. È inoltre possibile utilizzare probabilità previste per aiutarvi a capire il modello. È possibile calcolare probabilità previste utilizzando il comando margini, che è stato introdotto nel Stata 11. Di seguito si usa il comando margini per calcolare la probabilità prevista di ammissione ad ogni livello di rango. tenendo tutte le altre variabili nel modello a loro mezzi. Per ulteriori informazioni sull'utilizzo del comando margini per calcolare probabilità previste, vedi la nostra pagina Utilizzando margini probabilità previste. In uscita sopra vediamo che la probabilità prevista di essere accettato in un corso di laurea è 0,51 per le più alte istituzioni prestigio universitari (RANK1), e 0,18 per le istituzioni più ordinati (rank4), in possesso di GRE e GPA al loro mezzi. Di seguito si generano le probabilità previste per i valori di GRE da 200 a 800 con incrementi di 100. Dato che non abbiamo specificato sia atmeans o usato a (.) Per specificare i valori in si svolgono con le altre variabili predittive, i valori nella tabella sono probabilità medie previste calcolato utilizzando i valori dei campioni delle altre variabili predittive. Ad esempio, per calcolare la probabilità media previsto quando gre 200, la probabilità predetta è stato calcolato per ogni caso, utilizzando i valori casi di rango e GPA. con gre impostato a 200. Nella tabella qui sopra possiamo vedere che la media predetto probabilità di essere accettato è solo 0,167 se quelli punteggio GRE è 200 e aumenta a 0.414 se quelli punteggio GRE è di 800 (in media tra i valori dei campioni di GPA e rango ). Può anche essere utile usare i grafici di probabilità previste per comprendere presente eo il modello. Possiamo anche desiderare di vedere le misure di quanto bene il nostro modello si adatta. Questo può essere particolarmente utile quando si confrontano modelli concorrenti. Il comando fitstat scritto dall'utente produce una varietà di statistiche in forma. È possibile trovare ulteriori informazioni su fitstat digitando findit fitstat (vedi Come posso utilizzare il comando findit per la ricerca di programmi e ottenere ulteriore assistenza per ulteriori informazioni sull'uso findit). Le cose da considerare celle vuote o piccole cellule: si dovrebbe verificare per le celle vuote o piccoli facendo un campo incrociato tra i predittori categoriali e la variabile risultato. Se una cella ha pochissimi casi (un piccolo cellulari), il modello può diventare instabile o potrebbe non funzionare affatto. Separazione o quasi-separatore (chiamato anche previsione perfetta), una condizione in cui il risultato non varia in alcuni livelli delle variabili indipendenti. Vedi la nostra pagina FAQ: Qual è la separazione completa o quasi completa in regressione logisticprobit e come abbiamo a che fare con loro per informazioni sui modelli con perfetta previsione. Dimensioni del campione: modelli Sia logit e probit richiedono più casi di regressione OLS poiché utilizzano tecniche di stima di massima verosimiglianza. A volte è possibile stimare modelli per risultati binari nel set di dati con solo un piccolo numero di casi utilizzando esatto regressione logistica (utilizzando il comando exlogistic). Per ulteriori informazioni, consultare il nostro esempio l'analisi dei dati per precisa regressione logistica. E 'anche importante tenere presente che quando il risultato è rara, anche se l'insieme di dati globale è grande, può essere difficile stimare un modello logit. Pseudo-R-squared: Molte diverse misure di pseudo-R-squared esistere. Tutti tentativo di fornire informazioni simili a quelle fornite da R-squared in regressione OLS tuttavia, nessuno di loro può essere interpretata esattamente come R-squared in regressione OLS viene interpretato. Per una discussione di vari pseudo-R squareds vedono lungo e Freese (2006) o la nostra pagina delle FAQ Quali sono pseudo-R squareds Diagnostica: La diagnostica per la regressione logistica sono diverse da quelle per le OLS la regressione. Per una discussione di diagnostica modello per la regressione logistica, vedere Hosmer e Lemeshow (2000, capitolo 5). Si noti che la diagnostica fatto per la regressione logistica sono simili a quelle fatte per la regressione probit. In Stata, i valori di 0 vengono trattati come un livello della variabile risultato, e tutti gli altri valori non mancanti sono trattati come il secondo livello del risultato. dati in cluster: A volte le osservazioni sono raggruppati in gruppi (ad esempio le persone all'interno delle famiglie, studenti all'interno di aule). In questi casi, si consiglia di consultare la nostra pagina sulla non indipendenza all'interno di cluster. Riferimenti Hosmer, D. Lemeshow, S. (2000). Applied regressione logistica (Second Edition). New York: John Wiley Sons, Inc. lungo, J. Scott, Freese, Jeremy (2006). I modelli di regressione per le variabili dipendenti categoriali Uso Stata (Second Edition). College Station, TX: Stata Press. Lungo, J. Scott (1997). I modelli di regressione per le variabili dipendenti categoriali e limitato. Thousand Oaks, CA: Sage Publications. Il contenuto di questo sito web non deve essere interpretata come un'approvazione di un particolare sito web, il libro, o di un prodotto software dall'Università di California. NOTICE: Il gruppo di consulenza Idre statistica sarà la migrazione del sito web al CMS WordPress nel mese di febbraio per facilitare mantenimento e la creazione di nuovi contenuti. Alcune delle nostre pagine più vecchie verranno rimossi o archiviati in modo tale che essi non saranno più mantenuti. Cercheremo di mantenere i reindirizzamenti in modo che i vecchi URL continueranno a lavorare nel miglior modo possibile. Benvenuti al Istituto per la ricerca e l'istruzione digitale Aiuto Consulting Group Stat, dando un regalo Esempi Stata analisi dei dati informazioni probit Regressione Versione: Codice per questa pagina è stato testato in Stata 12. Probit regressione, chiamato anche un modello probit, viene utilizzato per il modello variabili di risultato dicotomiche o binarie. Nel modello probit, l'inverso normale distribuzione standard della probabilità è modellato come combinazione lineare dei predittori. Nota: Lo scopo di questa pagina è quello di mostrare come utilizzare i vari comandi di analisi dei dati. Esso non copre tutti gli aspetti del processo di ricerca, che sono tenuti ai ricercatori di fare. In particolare, non copre la pulizia dei dati e il controllo, la verifica di ipotesi, la diagnostica modello e potenziali analisi di follow-up. Esempi di probit regressione Esempio 1: Supponiamo che ci interessa i fattori che influenzano se un candidato politico vince le elezioni. La variabile di outcome (risposta) è binario (01) vincere o perdere. Le variabili predittive di interesse sono la quantità di denaro speso per la campagna, la quantità di tempo speso una campagna negativa e se il candidato è un operatore. Esempio 2: Un ricercatore è interessato a come variabili, come GRE (Graduate Record punteggi d'esame), GPA (media dei voti) e il prestigio dell'istituto universitario, effetto ammissione scuola di specializzazione. La variabile di risposta, admitdont ammettere, è una variabile binaria. Descrizione dei dati per la nostra analisi dei dati di seguito, ci accingiamo a espandere Esempio 2 di rimettersi in scuola di specializzazione. Abbiamo generato i dati ipotetici, che possono essere ottenuti dal nostro sito. Questo insieme di dati ha una risposta binaria (esito, dipendente) variabile chiamata ammettere. Ci sono tre variabili predittive: gre. GPA e rango. Tratteremo il GRE variabili e GPA come continuo. Il rango variabile è ordinale, assume i valori da 1 a 4. Gli enti con un punteggio di 1 hanno il più alto prestigio, mentre quelli con un grado di 4 hanno il più basso. Tratteremo rango come categorica. Metodi di analisi si potrebbe considerare Ecco un elenco di alcuni metodi di analisi si può avere incontrato. Alcuni dei metodi elencati sono abbastanza ragionevoli, mentre altri hanno uno caduto in disgrazia o hanno limitazioni. Probit regressione, il focus di questa pagina. Regressione logistica. Un modello logit produrrà risultati simili regressione probit. La scelta di probit contro logit dipende in gran parte le preferenze individuali. OLS la regressione. Quando utilizzato con una variabile risposta binaria, questo modello è noto come un modello lineare di probabilità e può essere usato come un modo per descrivere probabilità condizionali. Tuttavia, gli errori (cioè residui) dal modello di probabilità lineare violano la omoschedasticità e la normalità di errori ipotesi di regressione OLS, con conseguente errori standard validi e test di ipotesi. Per una discussione più approfondita di questi ed altri problemi con il modello di probabilità lineare vedere lungo (1997, p. 38-40). Due-gruppo di analisi discriminante. Metodo multivariata per le variabili di outcome dicotomiche. Hotellings T 2. Il 01 risultato viene trasformato in variabile di raggruppamento, e gli ex predittori si trasformano in variabili di risultato. Ciò produrrà un test generale di significatività, ma non darà singoli coefficienti per ciascuna variabile, e non è chiaro in che misura ciascun quotpredictorquot viene regolata per l'impatto degli altri quotpredictors. quot probit regressione seguito usiamo il comando probit di calcolare un modello di regressione probit. L'i. prima posizione indica che rango è una variabile fattore (cioè variabile categorica), e che dovrebbe essere inclusa nel modello come una serie di variabili indicatore. Si noti che questa sintassi è stata introdotta nel Stata 11. In uscita sopra, per prima cosa vedere il registro di iterazione, che indica quanto velocemente il modello convergente. La probabilità log (-229,20658) può essere utilizzato nei confronti di modelli annidati, ma trovarmici mostrano un esempio di quello qui. Anche nella parte superiore dell'uscita vediamo che tutte le 400 osservazioni nostri dati impostati sono stati utilizzati nell'analisi (meno osservazioni sarebbero stati utilizzati se qualcuno dei nostri variabili avevano valori mancanti). Il rapporto di verosimiglianza chi-quadrato di 41.56 con un p-value di 0.0001 ci dice che il nostro modello nel suo complesso è statisticamente significativa, vale a dire, si adatta molto meglio di un modello senza predittori. Nella tabella vediamo i coefficienti, i loro errori standard, la Z-statistica, associata p-value, e l'intervallo di confidenza 95 dei coefficienti. Entrambi gre. GPA. e le tre variabili indicatore di rango sono statisticamente significativi. I coefficienti di regressione probit danno la variazione dell'indice z-score o probit per una variazione unitaria nella predittore. Per un incremento unitario di gre. lo z-score aumenta di 0.001. Per ogni aumento di una unità in GPA. lo z-score aumenta di 0.478. Le variabili indicatore di rango hanno un'interpretazione leggermente diversa. Ad esempio, dopo aver frequentato un istituto universitario di rango pari a 2, contro un istituto con un rango di 1 (gruppo di riferimento), diminuisce il punteggio z per 0,415. Siamo in grado di testare per un effetto complessivo di rango con il comando di prova. Di seguito si vede che l'effetto complessivo di rango è statisticamente significativa. Possiamo anche testare ulteriori ipotesi circa le differenze tra i coefficienti per i diversi livelli di rango. Qui di seguito ci prova che il coefficiente di rango 2 è pari al coefficiente di rango 3. Si può anche utilizzare predetto probabilità che aiuta a capire il modello. È possibile calcolare probabilità previste utilizzando il comando margini, che è stato introdotto nel Stata 11. Di seguito si usa il comando margini per calcolare la probabilità prevista di ammissione ad ogni livello di rango. tenendo tutte le altre variabili nel modello a loro mezzi. Per ulteriori informazioni sull'utilizzo del comando margini per calcolare probabilità previste, vedi la nostra pagina Utilizzando margini probabilità previste. In uscita sopra vediamo che la probabilità prevista di essere accettato in un corso di laurea è 0,52 per le più alte istituzioni prestigio universitari (RANK1), e 0,19 per le istituzioni più ordinati (rank4), in possesso di GRE e GPA al loro mezzi. Di seguito si generano le probabilità previste per i valori di GRE da 200 a 800 con incrementi di 100. Dato che non abbiamo specificato sia atmeans o usato a (.) Per specificare i valori in cui si svolgeranno le altre variabili predittive, i valori riportati in tabella sono probabilità medie previste calcolato utilizzando i valori dei campioni delle altre variabili predittive. Ad esempio, per calcolare la probabilità media previsto quando gre 200, la probabilità predetta è stato calcolato per ogni caso, utilizzando detto valore casi di rango e di GPA. e l'impostazione gre a 200. Nella tabella qui sopra possiamo vedere che la media predetto probabilità di essere accettato è solo 0,16 se quelli punteggio GRE è 200 e aumenta a 0,42 se quelli punteggio GRE è di 800 (in media tra i valori dei campioni di GPA e rango ). Può anche essere utile usare i grafici di probabilità previste per comprendere presente eo il modello. Possiamo anche desiderare di vedere le misure di quanto bene il nostro modello si adatta. Questo può essere particolarmente utile quando si confrontano modelli concorrenti. Il comando fitstat scritto dall'utente produce una varietà di statistiche in forma. È possibile trovare ulteriori informazioni su fitstat digitando findit fitstat (vedi Come posso utilizzare il comando findit per la ricerca di programmi e ottenere ulteriore assistenza per ulteriori informazioni sull'uso findit). Le cose da considerare celle vuote o piccole cellule: si dovrebbe verificare per le celle vuote o piccoli facendo un campo incrociato tra i predittori categoriali e la variabile risultato. Se una cella ha pochissimi casi (un piccolo cellulari), il modello può diventare instabile o potrebbe non funzionare affatto. Separazione o quasi-separatore (chiamato anche previsione perfetta), una condizione in cui il risultato non varia in alcuni livelli delle variabili indipendenti. Vedi la nostra pagina FAQ: Qual è la separazione completa o quasi completa in regressione logisticprobit e come abbiamo a che fare con loro per informazioni sui modelli con perfetta previsione. Dimensioni del campione: modelli Sia probit e logit richiedono più casi di regressione OLS poiché utilizzano tecniche di stima di massima verosimiglianza. A volte è possibile stimare modelli per risultati binari nel set di dati con solo un piccolo numero di casi utilizzando esatto regressione logistica (utilizzando il comando exlogistic). Per ulteriori informazioni, consultare il nostro esempio l'analisi dei dati per precisa regressione logistica. E 'anche importante tenere presente che quando il risultato è rara, anche se l'insieme di dati globale è grande, può essere difficile stimare un modello probit. Pseudo-R-squared: Molte diverse misure di pseudo-R-squared esistere. Tutti tentativo di fornire informazioni simili a quelle fornite da R-squared in regressione OLS tuttavia, nessuno di loro può essere interpretata esattamente come R-squared in regressione OLS viene interpretato. Per una discussione di vari pseudo-R squareds vedono lungo e Freese (2006) o la nostra pagina delle FAQ Quali sono pseudo-R squareds In Stata, i valori di 0 vengono trattati come un livello della variabile risultato, e tutti gli altri valori non mancanti sono trattati come il secondo livello del risultato. Diagnostica: La diagnostica per la regressione probit sono diversi da quelli per OLS la regressione. La diagnostica per i modelli probit sono simili a quelli per i modelli logit. Per una discussione di diagnostica modello per la regressione logistica, vedere Hosmer e Lemeshow (2000, capitolo 5). Riferimenti Hosmer, D. Lemeshow, S. (2000). Applied regressione logistica (Second Edition). New York: John Wiley Sons, Inc. lungo, J. Scott (1997). I modelli di regressione per le variabili dipendenti categoriali e limitato. Thousand Oaks, CA: Sage Publications. Il contenuto di questo sito web non deve essere interpretata come un'approvazione di un particolare sito web, il libro, o di un prodotto software dalla University of California.

Comments

Popular posts from this blog

Lil Durk Ho Ottenuto Contanti Scaricare Forex

Media Strategie Reversione Forexpros

Platformy Forex Pace