Un método alternativo para la selección de modelos de clases latentes en datos binarios escasos: una ilustración con datos sim

En el contexto de modelos de clases latentes con variables manifiestas binarias, se propone un método alternativo para resolver el problema de la estimación de la distribución empírica con tablas de contingencias escasas, donde la aproximación de los estadísticos de bondad de ajuste por la dis...

Descripción completa

Detalles Bibliográficos
Autor principal: Araya Alpizar, Carlomagno
Formato: Online
Idioma:eng
Publicado: Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA) 2017
Acceso en línea:https://revistas.ucr.ac.cr/index.php/matematica/article/view/22448
id RMTA22448
record_format ojs
institution Universidad de Costa Rica
collection Revista de Matemática: Teoría y Aplicaciones
language eng
format Online
author Araya Alpizar, Carlomagno
spellingShingle Araya Alpizar, Carlomagno
Un método alternativo para la selección de modelos de clases latentes en datos binarios escasos: una ilustración con datos sim
author_facet Araya Alpizar, Carlomagno
author_sort Araya Alpizar, Carlomagno
description En el contexto de modelos de clases latentes con variables manifiestas binarias, se propone un método alternativo para resolver el problema de la estimación de la distribución empírica con tablas de contingencias escasas, donde la aproximación de los estadísticos de bondad de ajuste por la distribución Chi-Cuadrada no es válida. Se analiza datos binarios escasos, donde muchos patrones de respuesta que tienen frecuencias esperadas pequeñas, en conjuntos de datos con grados de datos escasos de 1 a 5, donde d = n/2p = n/R es un factor es mencionado en la literatura como determinante de la bondad de ajuste a la distribución Chi-Cuadrada. La propuesta presenta resultados válidos y confiables en las condiciones de los datos mencionadas. Para los resultados se presenta tasas de error tipo I para las pruebas tradiciones de bondad de ajuste. También se muestra que para niveles de densidad de datos d ≤ 5, el estadístico Pearson (χ2) no es el apropiado para seleccionar modelos de clases latentes utilizando el Método de Patrones, dado que presenta probabilidad de error de tipo I más grandes que 5%. Al comparar el Método de Patrones y el Bootstrap Paramétrico para la densidad d = 2, se muestra que el Método de Patrones tiene probabilidades de error de tipo I menores de 5% en los estadísticos de razón de verosimilitud, Read-Cressie y Freeman-Tukey. En contraste, el Bootstrap Paramétrico produce valores en estos estadísticos que superan un 5%.
title Un método alternativo para la selección de modelos de clases latentes en datos binarios escasos: una ilustración con datos sim
title_short Un método alternativo para la selección de modelos de clases latentes en datos binarios escasos: una ilustración con datos sim
title_full Un método alternativo para la selección de modelos de clases latentes en datos binarios escasos: una ilustración con datos sim
title_fullStr Un método alternativo para la selección de modelos de clases latentes en datos binarios escasos: una ilustración con datos sim
title_full_unstemmed Un método alternativo para la selección de modelos de clases latentes en datos binarios escasos: una ilustración con datos sim
title_sort un método alternativo para la selección de modelos de clases latentes en datos binarios escasos: una ilustración con datos sim
title_alt An alternative to classical latent class models selection methods for sparse binary data: an illustration with simulated data
publisher Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA)
publishDate 2017
url https://revistas.ucr.ac.cr/index.php/matematica/article/view/22448
work_keys_str_mv AT arayaalpizarcarlomagno analternativetoclassicallatentclassmodelsselectionmethodsforsparsebinarydataanillustrationwithsimulateddata
AT arayaalpizarcarlomagno unmetodoalternativoparalaselecciondemodelosdeclaseslatentesendatosbinariosescasosunailustracioncondatossim
AT arayaalpizarcarlomagno alternativetoclassicallatentclassmodelsselectionmethodsforsparsebinarydataanillustrationwithsimulateddata
_version_ 1811744094282579968
spelling RMTA224482022-01-31T16:42:11Z An alternative to classical latent class models selection methods for sparse binary data: an illustration with simulated data Un método alternativo para la selección de modelos de clases latentes en datos binarios escasos: una ilustración con datos sim Araya Alpizar, Carlomagno sparse data latent class goodness-of-fit binary data datos escasos clases latentes bondad de ajuste datos binarios Within the context of a latent class model with manifest binary variables, we propose an alternative method that solves the problem of estimating empirical distribution with sparse contingency tables and the chi-square approximation for goodness-of-fit will not be valid. We analyze sparse binary data, where there are many response patterns with very small expected frequencies in several data sets varying in degree of sparseness from 1 to 5 defined d = n/2p = n/R is a factor that is mentioned in almost all prior literature as being an important determinant of how well the distribution is represented by the chi-squared.The proposed approach produced results that were valid and reliable under the mentioned problematic data conditions. Results from the proposal presented compare the rates of Type I for traditional goodness-of-fit tests. We also show that with data density d ≤ 5, Pearson’s statistic (χ2) should not be used to select latent class models using the Patterns Method, given that this has the probability of Type I error being greater than 5%. By comparing the Patterns Method and the Parametric Bootstrap for data density d = 2, we show that the Patterns Method has more accurate Type I error probabilities since the likelihood ratio, Read-Cressie and Freeman-Tukey statistics afford values of α < 0.05. In contrast, the Parametric Bootstrap provides values in these statistics that surpass 5%. En el contexto de modelos de clases latentes con variables manifiestas binarias, se propone un método alternativo para resolver el problema de la estimación de la distribución empírica con tablas de contingencias escasas, donde la aproximación de los estadísticos de bondad de ajuste por la distribución Chi-Cuadrada no es válida. Se analiza datos binarios escasos, donde muchos patrones de respuesta que tienen frecuencias esperadas pequeñas, en conjuntos de datos con grados de datos escasos de 1 a 5, donde d = n/2p = n/R es un factor es mencionado en la literatura como determinante de la bondad de ajuste a la distribución Chi-Cuadrada. La propuesta presenta resultados válidos y confiables en las condiciones de los datos mencionadas. Para los resultados se presenta tasas de error tipo I para las pruebas tradiciones de bondad de ajuste. También se muestra que para niveles de densidad de datos d ≤ 5, el estadístico Pearson (χ2) no es el apropiado para seleccionar modelos de clases latentes utilizando el Método de Patrones, dado que presenta probabilidad de error de tipo I más grandes que 5%. Al comparar el Método de Patrones y el Bootstrap Paramétrico para la densidad d = 2, se muestra que el Método de Patrones tiene probabilidades de error de tipo I menores de 5% en los estadísticos de razón de verosimilitud, Read-Cressie y Freeman-Tukey. En contraste, el Bootstrap Paramétrico produce valores en estos estadísticos que superan un 5%. Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA) 2017-04-19 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Article application/pdf https://revistas.ucr.ac.cr/index.php/matematica/article/view/22448 10.15517/rmta.v23i1.22448 Revista de Matemática: Teoría y Aplicaciones; Vol. 23 No. 1 (2016): Revista de Matemática: Teoría y Aplicaciones; 199-220 Revista de Matemática: Teoría y Aplicaciones; Vol. 23 Núm. 1 (2016): Revista de Matemática: Teoría y Aplicaciones; 199-220 Revista de Matemática; Vol. 23 N.º 1 (2016): Revista de Matemática: Teoría y Aplicaciones; 199-220 2215-3373 1409-2433 eng https://revistas.ucr.ac.cr/index.php/matematica/article/view/22448/22614 Derechos de autor 2016 Revista de Matemática: Teoría y Aplicaciones