Contoh Data Regresi Logistik Binary Options


Tutorial Contoh Analisis Regreso Logistik biner / dikotomi dengan SPSS Pada hari sebelumnya telah dibahas tentang konsep dari regresi logistik biner. Sesuai dengan janji penulis akan dibahas tutorial regresi logistik biner dengan SPSS. (Kayak pemilu aja ya.:p). Untuk contoh kasus kali ini, terispirasi dari tugas kelompok perkuliahan yang diambil dari tugas kakak tingkat. Bisa dibilang copas lah ya. Tapi, jangan dilihat dari copasnya. Tapi lihat dari niatnya dan keinginan untuk saling berbagi semoga dapat membantu mengerjakan tugas, skripsi, tesis atau bahkan disertasi. Contoh Kasus Analisis Regresi Logistik biner: Dilakukan simulasi untuk melihat pengaruh antara variabilidad profitabilitas, kompleksitas perusahaan, opini auditor, likuiditas dan ukuran perusahaan terhadap ketepatan penyampaian laporan keuangan tahunan perusahaan. Profitabilitas diukur dengan ROA Variable kompleksitas terdiri atas 2 kategorik yaitu diberi angka 2 jika mempunyai anak perusahaan dan 1 jika perusahaan tidak mempunyai anak perusahaan opini auditor diukur dengan 2 jika mendapatkan opini wajar tanpa pengecualian dan 1 untuk opini yang lain likuiditas diukur dengan Current Ratio dan ukuran Perusahaan diukur dengan logaritma valor natural de mercado. Variabel terikatnya adalah ketepatan penyampaian laporan keuangan, dengan kode 1 para el yang yang tepat waktu dan 0 para el peru yan terlambat. Los datos yang digunakan dalam penelitian ini tidak diceampilkan mungkin kalau teman ingin mencoba juga bisa didownload dibagian bawah nanti ya. Dalam tutorial ini menggunakan SPSS 20.Langsung saja ya dengan langkah-langkahnya. Langkah-langkah dalam pengujian analisis regresi logistik Pada archivo posisi archivo terabyta, maka akan terlihat pada layar datos tentación kebab penyampaian laporan keuangan perusahaan dengan sejumlah variabel-variabelnya. Ungüento de menganalisis, langkah awalnya adalah pilih menu Analizar. Kemudian pilih Regresión dan Logística binaria. Maka akan muncul tampilan seperti di bawah ini. Masukan variabel yang berfungsi sebagai variabel tak bebas dari caja variabel ke kolom dependiente. Dan masukan sin embargo varibel bebas pada kotak Covariate. Untuk Método, pilih Enter. Sebenarnya bisa dipilih metodo apa saja karena modelo yang terbentuk akan sama (dalam artian penduga-penduga parameternya akan memiliki nilai-nilai yang sama). Akan tetapi, khusus metode Entrar, harus dilakukan proses dua kali. Pertama, los datos se llevan a cabo de forma semántica variable para el hombre variable y el significado de la mancha y el significado de la palabra. Modelo yang terbentuk akan sama dengan modelo yang diperoleh dengan metode lain. Klik Categorical. Masukkan semua variabel bebas yang berbentuk kategori pada kotak covariate ke dalam kotak categórico covariables. Biarkan contras pada indicador por defecto. Untuk referencia kategori pilih bagian kategori yang akan dipakai sebagai referencias atau pembanding yang akan digunakan dalam interpretasi odds ratio. Dapat menggunakan kategori akhir (último) atau kategori pertama (primero). Dalam penelitian en digunakan kategori akhir (último). Kemudian klik Continuar. Setelah itu pilih opción de menú. Centang iteration historia untuk dapat mengetahui proses iterasi yang telah berlangsung. Selain itu, akan ditemukan Clasificación cortada, yang pada kondisi defecto sudah diisi dengan 0.5. Nilai ini disebut dengan el valor de corte atau anterior probabilidad. Peluang suatu observasi untuk masuk ke salah satu kelompok sebelum karakteristik variabel penjelasnya diketahui. Jika kita tidak mempunyai información sobre la base de datos de búsqueda, maka kita bisa menggunakan default. Misalnya pada penelitian ini, sebelumnya tidak pernah dilakukan penelitiano apakah ukuran perusahaan condong pada satu sisi. Dengan alasan ini, dapat digunakan Clasificación de corte sebesar 0,5. Namun, misalnya pada ada penelitian lain yang telah meneliti maka bisa dinaikkan / diturunkan clasificación corte sesuai hasil penelitian. Dalam penelitian ini semua variabel numerik dalam default 0,5. Abaikan bagain yang lain, klik continuar. Abaikan bagian yang lain, dan tekan OK maka akan keluar salida de Regresi Logistik. Intrepretasi Hasil analisis regresi logistik Setelah keluar salida dari hasil datos de ejecución de SPSS maka diperoleh hasil analisis sebagai berikut: Identifikasi Data yang Hilang Pada tabulador de datos, dapat dilihat tidak ada datos yang hilang (casos faltantes). Pemberly, kode, variabel, respon, ole, SPSS, Menú, pengkodean, SPSS, yang, termasuk, kategori, sudaderas, adalah, penyampaian, laporan, keuangan, tahunan, yang, tepat. Pemberian kode untuk variabel penjelas yang kategorik Pengkodean variabel penjelas hanya dilakukan untuk variabel penjelas yang kategorik karena akan dibentuk dummy variabel. Penelitian ini menggunakan dela variabel penjelas yang kategorik yaitu variabel Opiniones de usuarios de Kompleksitas. Untuk variabel opini. Nantinya yang akan digunakan código de referencia sebagai (kode pembanding) adalah Wajar Tanpa Pengecualian (lihat pada tabel di atas parametros bagian codificaciones yang berkode nol). Sementara untuk variabel Kompleksitas. Yang menjadi kode pembanding adalá Punya anak perusahaan. Kode es una herramienta que puede ayudarte a resolver el problema. Uji Signifikansi Modelo Dari hasil SPSS dapat digunakan tabel 8220 Pruebas Omnibus de Coeficientes Modelo 8221 untuk melihat hasil pengujian secara simultan pengaruh variabel bebas ini. Tabla de contenido de las tablas de diáfanos Sig. Modelo sebesar 0.000. Karena, nilai ini lebih, keila, 5, maka, kita, menolak, Hoja, tingkat, signifikansi, 5, sehingga, disimpulkan, bahwa, variavel, bebas, yang, digunakan, secara, bersama-sama, berbengaruh, terhadap, ketepatan, penyampaian, laporan, keuangan, suatu, perusahaan. Atau mínimo ada satu variabel bebas yang berpengaruh. Persentase Ketepatan Klasifikasi (Porcentaje correcto) Persentase ketepatan modelo dalam mengkasifikasikan observasi adalah 78.6 persen. Artinya dari 70 observasi, ada 55 observasi yang tepat pengklasifikasiannya oleh modelo regresi logistik. Jumlah observasi yang tepat pengklasifikasiannya dapat dilihat pada diagonal utama. Uji Parsial dan Pembentukan Modelo Pada uji diharapkan Ho akan ditolak sehingga variabel yang sedán diuji masuk ke dalam modelo. Dengan bantuan tabel 8220Variables en The Equation8221 dapat dilihat variabel mana saja yang berpengaruh significativo sehingga bisa dimasukkan modelo ke. Jika nilai sig. lta maka Ho ditolak. Berksarkan hasil di atas diketahui bahwa terdapat 2 variabel bebas yang signifikan berpengaruh terhadap ketepatan penyampaian laporan keuangan perusahaan karena masing-masing variabel tersebut memiliki nilai signifikansi yang lebih kecil dari a5. Variabel-variabel tersebut adalah Profitabilitas (Sig.0.004) dan Likuiditas (Sig.0.000). Modelo yang terbentuk adalah: Dimana: X1i Profitabilitas X2i Likuiditas i1,2,8230, n 7. Interpretasi Odds Ratio Nilai Odds ratio ini jugable disediakan oleh tabel 8220 Variables en la ecuación 8221 pada kolom Exp (B): Berdasarkan hasil di atas kita dapat Menginterpretasikan Rango de cuotas sebagai berikut: Jika jumlah rentabilitas perusahaan bertambah 1 unidad maka kecendrungan perusahaan tersebut untuk tepat waktu menyampaikan laporan keuangan menjadi 2.780 kali lipat. Sebuah perusahaan yang tidak mempunyai anak perusahaan akan memiliki kecenderungan untuk menyampaikan laporan keuangan secara tepat waktu sebesar 3.057 kali dibanding perusahaan yang memiliki anak perusahaan (merujuk pada código de referencia). Perusahaan dengan opini auditor adalah opini lain cenderung 0.848 kali (lebih rendah) untuk tepat waktu dalam menyampaikan laporan keuangan dibanding dengan perusahaan yang Wajar tanpa Pengecualian. Jika Relación actual pada likuiditas bertambah 1 persen maka perusahaan akan cenderung 1.708 kali untuk tepat waktu menyampaikan laporan keuangannya. Por favor haga clic aquí para ver el código de ahorro de la máquina 1 unidad maka perusahaan tersebut cenderung 1.123 kali untuk tepat waktu dalam menyampaikan laporan keuangannya. Buat yang ingin mencoba silahkan descargar filenya dibawah ini: tutorial reglog biner (SPSS 20) Escrito por: Nasrul Setiawan Terima kasih sudah membaca artikel Analisis regresi / Regresi Logistik / SPSS dengan judul Tutorial Contoh Analisis Regresi Logistik biner / dikotomi dengan SPSS. Anda bisa marcador halaman ini dengan URL statistikceria. blogspot / 2013/01 / tutorial-analisis-regresi-logistik. html. Apabila ada yang kurang jelas silahkan tinggalkan komentar atau pesan. Regreso logistic merupakan salah satu analisi multivariante, yang berguna untuk memprediksi variable dependiente berdasarkan variabel independen. Pada logística regresi, dependen variabel adalah variabel dikotomi (kategori). Ketika de la variabilidad de la dependencia de la división de la música de la logística binaria de digunakan binario, de la ketika dependen de la variable de la música de la división de la regla logística multinominal. Lalu ketika dependen variabelnya berbentuk ranking, maka disebut dengan regresión logística ordinal. Konsep Regresi Logistik Regresa logistica merupakan alternativo uji jika asumsi multivariate normal distribution pada variabel bebasnya tidak bisa terpenuhi ketika akan dilakukan analisis diskriminan. Tidak terpenuhinya asumsi en dikarenakan variabel bebas merupakan campuran antara variabel kontinyu (métrico) dan kategorial (no métrico). Misalnya, probabilitas bahwa orang yang menderita serangan jantung pada waktu tertendo dapat dipredis dari informasi usia, kebiasaan merokok, jenis kelamin, dan lainnya. Asumsi Regresi Logistik Regresar logistik tidak membutuhkan hubungan linier antara variabel bebas dengan variabel terikat. Regresar a la lista de los resultados de la discusión. Odd dalam regresi logistik sering dinyatakan sebagai probabilitas. Misal Odd sebuah perusahaan dapat bangkrut atau berhasil atau extraño seorang anak dapat lulus atau tidak pada Ujian Nasional. Variable bebas tidak memerlukan asumsi multivariante normalidad Asumsi homokedastis tidak diperlukan Variable bebas tidak perlu dirubah ke bentuk métrico (intervalo atau skala ratio) CONTOH KASUS Regresión Logística Datos Yang Diberikan Adalah Datos Fiktif Bukan Datos Sebarnya, Cuma Sebagai Latihan Uji Estadísticas Seorang dokter ingin mengetahui probabilitas seorang Pasien terkena penyakit jantung berdasarkan rutinitas kebiasaan merokok dan usia Datos de dikumpulkan dari catatan medis sebanyak 30 orang pasien yang melakukan pemeriksaan kesehatan di RS (1), tdk merokok (0) Usada (usia dalam tahun) Pada menu Análisis, Pilih Regresión gtgt Binario Logístico Masukkan variabel sakit ke Dependiente, kemudian variabel rokok dan usia ke 8220covariate box8221 Kemudian, Opciones de Klik, lalu beri tanda pada Clasificación de parcelas, Hosmer-Lemeshow GoF, Matriz de correlación, historia de la iteración Klik Continuar, kemudian OK HASIL Dan INTERPRESTASI Menilai Model Fit Untuk Menilai model fit dapat diperhatikan nilai statistik -2LogL yaitu tanpa mengikutsertakan variabel hanya berupa konstanta yaitu sebesar 41.589. Ketika dimasukkan 2 variable baru maka prediksi nilai -2LogL sebesar 16.750. Artinya terdapat penurunan sebesar 41.589 8211 16.750 24.839. Untuk -2LogL pertama diperoleh nilai 41.589 dengan df1 30-1 29. Nilai ini signifikan pada alfa 5 yang berarti En este momento está en la escuela. Nilai -2LogL kedua adalah sebesar 16.750 dengan df2 30-3 27 adalá tidak signifikan pada alfa 5. (Nilai statistik -2LogL di atas dibandingkan dengan nilai statistik distribusi x2.), Modelo artinya ajuste datos dengan. Statistik - LogL dapat digunakan untuk menentukan apakah jika variabel bebas dimasukkan dalam modelo dapat secara signifikan mempengaruhi modelo. Dengan selisih 24.839 dan df (df1-df229-272) maka menunjukkan angka ini signifikan pada alfa 5. Hal ini berarti Fuera de los datos de ajuste de modelo dengan. Cox n Snell8217s R Cuadrado adalah ukuran pengaruh bersama yaitu sebesar 0.563 dan nilai Nagelkerke R Cuadrado adalah sebesar 0.751. Dengan demikian dapat disimpulkan bahwa kemampuan variabel bebas menjelaskan modelo adalah sebesar 75.10. Selanjutnya, Hosmer y Lemeshow8217s GoF dilakukan untuk menguji hipotesis. Jika sig lt 0.05 maka Ho ditolak yang berarti ada perbedaan signifikan antara modelo dengan nilai observasinya. Jika sig gt 0.05 maka Ho diterma, artinya tidak ada perbedaan antara modelo dan nilai observasinya. Estadística Hosmer y Lemeshow8217s GoF diperoleh sebesar 0.594 (gt 0.05) sehingga dapat dinyatakan modelo bahwa modelo dengan datos. Hosmer y Lemeshow8217s GoF juga menghasilkan nilai 6.475 probabilidades sebesar 0.594 sehingga dapat disimpulkan bahwa modelo ajuste dengan datos. Estimaci Parámetro dan Interprestasi Estimai Máximo Likehood parámetro modelo dapat dilihat dari salida pada tabel Variables en la ecuación. Regresión Logística kemudian dapat dinyatakan: Ln P / 1-P -11.506 5.348 Rokok .210 Usia. Variabel bebas kebiasaan merokok signifikan dengan probabilitas sebesar 0.004 (lt 0.05) dan variabel usia juga signifikan dengan probabilitas 0.032. Dengan memperhatikan persaman ini maka dapat diinterprestasikan sbb: Registro de probabilidades seseorang terkena secara positif berhubungan dengan rokok. Probabilitas atau Probabilidades seorang terkena penyakit jantung jika ia perokok adalah sebesar 5.348. Artinya seorang perokok, memiliki, kemungkinan, terkena, serangan, jantung, 5,35, kali, lebih, besar, dibanding, yang, tidak, merokok. Jika variabel rokok dianggap konstán, maka probabilitas seseorang terkena serangan jantung adalah sebesar 0.210 pada setiap kenaikan satu tahun usia. Jika Rokok dianggap konstán, maka seseorang memiliki probabilidades terkena penyakit jantung adalá sebesar 1.233 untik setiap penambahan usia. Sementara jika usia bernilai konstán maka probabilidades seorang terkena penyakit jantung adalá sebesar 210.286 uniken dunken yang tidak merokok. Hasil índice de clasificación general adalah sebesar 90.0 pada cutoff 50 Pertama. Variabel rokok dan usia memiliki hubungan positif dengan probabilidades penyakit jantung Kedua. Jika usia bernilai konstán, maka seorang perokok memiliki las probabilidades terkena penyakit jantung sebesar 5.384 kali lebih besar dibanding yang tidak merokok Ketiga. Jika rokok bernilai konstán, maka probabilidades seorang terkena penyakit jantung adalá sebesar 0.210 pada setiap penambahan usia. Cuma diingatkan8230.data yang Diberikan Datos de Adalah Fiktif Bukan Datos de Sebama, Cuma Sebagai Latihan Uji Estadísticas Imam Ghozali. 2009. Aplikasi Analisis Programa multivariado de dengan SPSS. Semarang BP: Undip, hal. 261-275Bienvenidos al Instituto de Investigación y Educación Digital Ejemplos de Análisis de Datos de SPSS Regresión Probit La regresión Probit, también llamada modelo probit, se usa para modelar variables de resultado dicotómicas o binarias. En el modelo probit, la distribución normal estándar inversa de la probabilidad se modela como una combinación lineal de los predictores. Nota: El propósito de esta página es mostrar cómo usar varios comandos de análisis de datos. No abarca todos los aspectos del proceso de investigación que se espera que hagan los investigadores. En particular, no cubre la limpieza y verificación de datos, la verificación de supuestos, el diagnóstico de modelos y los posibles análisis de seguimiento. Ejemplos Ejemplo 1: Supongamos que estamos interesados ​​en los factores que influyen en si un candidato político gana una elección. La variable de resultado es binaria (0/1) ganar o perder. Las variables predictoras de interés son la cantidad de dinero gastado en la campaña, la cantidad de tiempo dedicado a hacer campaña negativamente y si el candidato es un titular. Ejemplo 2: Un investigador está interesado en cómo las variables, como GRE (puntajes del examen de Graduate Record), GPA (promedio de calificaciones) y el prestigio de la institución de pregrado, hacen que la admisión en la escuela de posgrado. La variable de respuesta, admit / dont admit, es una variable binaria. Descripción de los datos Para nuestro análisis de datos a continuación, vamos a ampliar el ejemplo 2 sobre cómo ingresar a la escuela de posgrado. Hemos generado datos hipotéticos, que se pueden obtener haciendo clic en binary. sav. Puede almacenar esto donde lo desee, pero nuestros ejemplos asumirán que se ha almacenado en c: data. En primer lugar, leemos el archivo de datos en SPSS. Este conjunto de datos tiene una respuesta binaria (resultado, dependiente) variable llamada admitir. Hay tres variables predictoras: gre. Gpa y rango. Tratamos las variables gre y gpa como continuas. El rango variable es ordinal, toma los valores 1 a 4. Las instituciones con un rango de 1 tienen el más alto prestigio, mientras que las que tienen un rango de 4 tienen el más bajo. Tratamos el rango como categórico. Comencemos por ver estadísticas descriptivas. Métodos de análisis que podría considerar A continuación se muestra una lista de algunos métodos de análisis que puede haber encontrado. Algunos de los métodos enumerados son absolutamente razonables mientras que otros han caído de favor o tienen limitaciones. Probit regresión, el enfoque de esta página. Regresión logística. Un modelo logit producirá resultados similares a la regresión probit. La elección de probit versus logit depende en gran medida de las preferencias individuales. Regresión OLS. Cuando se utiliza con una variable de respuesta binaria, este modelo se conoce como modelo de probabilidad lineal y puede usarse como una forma de describir probabilidades condicionales. Sin embargo, los errores (es decir, los residuos) del modelo de probabilidad lineal violan los supuestos de homoscedasticidad y normalidad de errores de la regresión OLS, resultando en errores estándar inválidos y pruebas de hipótesis. Para una discusión más completa de estos y otros problemas con el modelo de probabilidad lineal, véase Long (1997, p.38-40). Análisis de la función discriminante en dos grupos. Un método multivariado para variables de resultado dicotómicas. Hotellings T 2. El resultado 0/1 se convierte en la variable de agrupación, y los predictores anteriores se convierten en variables de resultado. Esto producirá una prueba general de significancia, pero no dará coeficientes individuales para cada variable, y no está claro hasta qué punto cada quotpredictor o quot se ajusta para el impacto de los otros quitpredictors. quot Probit regresión Abajo usamos el comando plum con el subcomando / Linkprobit para ejecutar un modelo de regresión probit. Después del nombre del comando (ciruela), la variable de resultado (admitir) es seguida por el rango que indica que el rango es un predictor categórico, seguido por el grepa. Indicando que los predictores gre y gpa deben ser tratados como continuos. La salida del ciruelo está etiquetada como una regresión ordinal, sin embargo, podemos confirmar a continuación (ver la nota en el siguiente conjunto de tablas) que la función de enlace de probit se utilizó. Obsérvese que un modelo con un resultado binario puede ser visto como un caso especial de un modelo ordinal, donde sólo hay dos categorías. La tabla anterior incluye las frecuencias para las dos variables categóricas que admiten (el resultado) y rango (uno de los predictores). Podemos ver que las 400 observaciones se han utilizado. Se habrían utilizado menos observaciones si alguna de nuestras variables tuviera valores faltantes. La tabla etiquetada Model Fitting Information incluye dos filas, una para el modelo que solicitamos (etiquetada como Final) y otra para el llamado modelo nulo (Intercept Only). Las probabilidades de log 2 se pueden utilizar para comparar el ajuste del modelo de los dos modelos. La probabilidad de log final de -2 para nuestro modelo es 452.057. El modelo de intercepción sólo tiene una probabilidad de logarítmica de 493.620. El estadístico de prueba de chi-cuadrado de 41.563 es la diferencia entre las dos probabilidades de log2, esta estadística de prueba, con 5 grados de libertad y un p asociado de menos de 0.0004 nos dice que el modelo actual encaja mejor que un modelo con Sólo una intercepción. Los valores de Pseudo-R-cuadrado son otra forma de evaluar el ajuste del modelo. Tres diferentes pseudo-R-cuadrado se dan en la salida, pero muchas medidas diferentes de pseudo-R-cuadrados existen. Todos ellos intentan proporcionar información similar a la proporcionada por R-cuadrado en la regresión OLS sin embargo, ninguno de ellos puede interpretarse exactamente como R-cuadrado en la regresión OLS se interpreta. En la tabla titulada Parámetro Estimaciones, vemos los coeficientes, sus errores estándar, la estadística de prueba de Wald con los df asociados y P-valores, y el intervalo de confianza 95 de los coeficientes. Las variables gre. Gpa Y los términos para el rango 1 y rango 2 son estadísticamente significativos. Los coeficientes de regresión probit dan el cambio en la puntuación z (también llamado el índice probit) para un cambio de una unidad en el predictor. Para un aumento de una unidad en gre. La puntuación z aumenta en 0,001. Para cada unidad de aumento en gpa. La puntuación z aumenta en 0,478. Los términos para el rango tienen una interpretación ligeramente diferente. Por ejemplo, después de haber asistido a una institución de grado con un rango de 1, frente a una institución con un rango de 4 (el grupo de referencia), aumenta la puntuación z en 0.936. Podemos también desear probar el efecto total de la graduación. Lo podemos hacer usando el subcomando de prueba. El subcomando de prueba es seguido por el nombre de la variable que deseamos probar (es decir, rango), y luego un valor para cada nivel de esa variable (incluyendo la categoría omitida). La primera línea del subcomando de prueba rango 1 0 0 0 indica que queremos probar que el coeficiente para el rango 1 es 0. Para realizar una prueba de grado de libertad múltiple, incluimos varias líneas en el subcomando de prueba, todas excepto la última línea Se separa por un punto y coma. La segunda y tercera filas indican que queremos probar que los coeficientes de rango 2 y rango 3 son iguales a 0. Observe que no hay necesidad de incluir una fila para la cuarta categoría de rango. Debido a que los modelos son los mismos, la mayor parte de la salida producida por el comando de ciruela anterior es la misma que antes. La única diferencia es la salida adicional producida por el subcomando de prueba, sólo esta parte de la salida se muestra a continuación. La primera tabla, denominada Coeficientes de Contraste, muestra las hipótesis que estamos probando. La segunda tabla da los resultados de contraste, ya que cada fila en el subcomando de prueba prueba que un coeficiente en el modelo es igual a 0, estas estimaciones, errores estándar, etc. son iguales a los de la tabla denominada Parámetro Estimaciones en la parte principal de La salida. La única diferencia en esta tabla es que la columna etiquetada Test que da explícitamente la hipótesis nula, en nuestro caso, que cada uno de los términos es igual a 0. (Obsérvese que se pueden especificar otras hipótesis nulas.) La tabla final producida por el El test de Wald prueba de 21.361, con 3 grados de libertad, y un p-valor asociado de menos de 0.001, nos dice que el efecto global de El rango es estadísticamente significativo. La tabla etiquetada Parámetro Estimaciones da pruebas de hipótesis para las diferencias entre cada nivel de rango y la categoría de referencia. Podemos usar el subcomando de prueba para probar las diferencias entre los otros niveles de rango. Por ejemplo, es posible que desee probar una diferencia en los coeficientes de rango 2 y rango 3. En la sintaxis siguiente hemos añadido un segundo subcomando de prueba. Esta vez, los valores dados son 0 1 -1 0 esto indica que queremos calcular la diferencia entre los coeficientes para el rango 2 y el rango 3 (es decir, rango 2 - rango 3). De nuevo, la salida del modelo, así como la salida asociada con el primer subcomando de prueba son idénticas a las mostradas anteriormente, por lo que se omiten. En la tabla denominada Contraste Resultados vemos la diferencia en los coeficientes (es decir 0,397). La estadística de prueba de Wald de 5.573, con un grado de libertad, y el p asociado de menos de 0.02, indica que la diferencia entre los coeficientes para el rango 2 y el rango 3 es estadísticamente significativa. Debido a que sólo se especificó una estimación en el subcomando de prueba, no se imprime el ensayo de grado de libertad múltiple (es decir, la tabla Resultados de prueba). Cosas a considerar Células vacías o pequeñas: Debe comprobar si hay células vacías o pequeñas haciendo una tabla cruzada entre los predictores categóricos y la variable de resultado. Si una celda tiene muy pocos casos (una celda pequeña), el modelo puede volverse inestable o puede no funcionar en absoluto. Separación o cuasi separación (también llamada predicción perfecta), una condición en la cual el resultado no varía en algunos niveles de las variables independientes. Consulte nuestra página FAQ: ¿Qué es la separación completa o cuasi-completa en la regresión logística / probit y cómo tratamos con ellos para obtener información sobre modelos con predicción perfecta. Tamaño de la muestra: Los modelos logit y probit requieren más casos que la regresión OLS porque utilizan técnicas de estimación de máxima verosimilitud. También es importante tener en cuenta que cuando el resultado es raro, incluso si el conjunto de datos es grande, puede ser difícil estimar un modelo logit. Pseudo-R-cuadrado: Existen muchas medidas diferentes de pseudo-R-cuadrado. Todos ellos intentan proporcionar información similar a la proporcionada por R-cuadrado en la regresión OLS sin embargo, ninguno de ellos puede interpretarse exactamente como R-cuadrado en la regresión OLS se interpreta. Para una discusión de varios pseudo-R-squareds ver Long y Freese (2006) o nuestra página de preguntas frecuentes ¿Qué son pseudo R-cuadrados Diagnóstico: Los diagnósticos para la regresión logística son diferentes de los de regresión OLS. Para una discusión sobre el modelo de diagnóstico para la regresión logística, véase Hosmer y Lemeshow (2000, capítulo 5). Tenga en cuenta que los diagnósticos realizados para la regresión logística son similares a los realizados para la regresión probit. Véase también Referencias Hosmer, D. Lemeshow, S. (2000). Regresión Logística Aplicada (Segunda Edición). Nueva York: John Wiley Sons, Inc. Long, J. Scott (1997). Modelos de regresión para variables categóricas y dependientes limitadas. Thousand Oaks, CA: Publicaciones de Sage. El contenido de este sitio web no debe ser interpretado como un endoso de cualquier sitio web, libro o producto de software en particular por la Universidad de California.

Comments

Popular posts from this blog

Binary Option Rapid Fire

47 Operadores De Forex Arrestados

1 2 3 Sistema De Comercio