Una alternativa al Algoritmo Chaid de segmentación basada en entropía

La técnica de segmentación basada en árboles CHAID (Detección Automática de Interacción basada en el Chi Cuadrado, o Chi-Squared Automatic Interaction Detection, por sus siglas en inglés) ha mostrado ser útil para obtener segmentos significativos que sean predictivos de una variable criterio de K ca...

Descripción completa

Detalles Bibliográficos
Autores principales: Galindo Villardón, María Purificación, Vicente Villardón, José Luis, Dorado Díaz, Ana, Vicente Galindo, Purificación, Patino Alonso, María Carmen
Formato: Online
Idioma:spa
Publicado: Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA) 2010
Acceso en línea:https://revistas.ucr.ac.cr/index.php/matematica/article/view/2127
Descripción
Sumario:La técnica de segmentación basada en árboles CHAID (Detección Automática de Interacción basada en el Chi Cuadrado, o Chi-Squared Automatic Interaction Detection, por sus siglas en inglés) ha mostrado ser útil para obtener segmentos significativos que sean predictivos de una variable criterio de K categorías (nominal u ordinal). CHAID fue diseñado para detectar, de manera automática, la interacción entre  varios predictores categóricos u ordinales para explicar una respuesta categórica,  pero esto puede no ser cierto cuando se presenta la paradoja de Simpson. Esto se debe al hecho de que CHAID es un algoritmo de selección hacia adelante basado en conteos marginales. En este artículo proponemos un algoritmo de eliminación hacia atrás que empieza con el conjunto completo de predictores (o árbol completo) y elimina progresivamente predictores. El procedimiento de eliminación está basado en contrastes de independencia condicional usando el concepto de entropía. El procedimiento propuesto es comparado con CHAID.