Curvas ROC y vecinos cercanos, propuesta de un nuevo algoritmo de condensación

Los criterios k-NN son algoritmos no paramétricos de clasificación estadística. Son precisos, versátiles y libres de distirbución. Sin embargo su costo computacional puede ser demasiado alto; especialmente con tamaños de muestra grandes. Presentamos un nuevo algoritmo de condensación que, basado en...

Descripción completa

Detalles Bibliográficos
Autores principales: Jiménez-Padilla, Raquel, Cuevas-Covarrubias, Carlos
Formato: Online
Idioma:spa
Publicado: Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA) 2011
Acceso en línea:https://revistas.ucr.ac.cr/index.php/matematica/article/view/2112
id RMTA2112
record_format ojs
spelling RMTA21122022-01-25T18:50:51Z Curvas ROC y vecinos cercanos, propuesta de un nuevo algoritmo de condensación Curvas ROC y vecinos cercanos, propuesta de un nuevo algoritmo de condensación Jiménez-Padilla, Raquel Cuevas-Covarrubias, Carlos statistical classification area under the ROC curve nearest neighbours condensation Monte Carlo clasificación estadística área bajo la curva ROC modelo binormal vecinos cercanos condensación Monte Carlo k-NN criteria are non parametric methods of statistical classificaction. They are accurate, versatile and distribution free. However,  their computational cost may be too expensive; especially for large sample sizes. We present a new condensation algorithm based on the Binormal model for ROC curves. It transforms the training sample into a small set of low dimensional vetors. Contrasting with other condensation techniques described in the literature, our proposal helps to control the exchange of accuracy for condensation onthe training sample. The results of a Monte Carlo study show that its performance can be very competitive in different realistic scenarios, resulting in better training samples than other frequently used methods. Los criterios k-NN son algoritmos no paramétricos de clasificación estadística. Son precisos, versátiles y libres de distirbución. Sin embargo su costo computacional puede ser demasiado alto; especialmente con tamaños de muestra grandes. Presentamos un nuevo algoritmo de condensación que, basado en el modelo Binormal para curvas ROC, permite transformar la base de entrenamiento en un conjunto pequeño de vectores de baja dimensión. A diferencia de otras técnicas escritas en la literatura, nuestra propuesta permite controlar el intercambio de precisión por reducción de la base de entrenamiento. Un estudio de Monte Carlo muestra que el desempeño del método popuesto puede ser muy competente, superando en diversos escenarios realistas al de otros métodos frecuentemente utilizados. Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA) 2011-02-01 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Article application/pdf https://revistas.ucr.ac.cr/index.php/matematica/article/view/2112 10.15517/rmta.v18i1.2112 Revista de Matemática: Teoría y Aplicaciones; Vol. 18 No. 1 (2011): Revista de Matemática: Teoría y Aplicaciones; 21-32 Revista de Matemática: Teoría y Aplicaciones; Vol. 18 Núm. 1 (2011): Revista de Matemática: Teoría y Aplicaciones; 21-32 Revista de Matemática; Vol. 18 N.º 1 (2011): Revista de Matemática: Teoría y Aplicaciones; 21-32 2215-3373 1409-2433 spa https://revistas.ucr.ac.cr/index.php/matematica/article/view/2112/2075 Derechos de autor 2011 Revista de Matemática: Teoría y Aplicaciones
institution Universidad de Costa Rica
collection Revista de Matemática: Teoría y Aplicaciones
language spa
format Online
author Jiménez-Padilla, Raquel
Cuevas-Covarrubias, Carlos
spellingShingle Jiménez-Padilla, Raquel
Cuevas-Covarrubias, Carlos
Curvas ROC y vecinos cercanos, propuesta de un nuevo algoritmo de condensación
author_facet Jiménez-Padilla, Raquel
Cuevas-Covarrubias, Carlos
author_sort Jiménez-Padilla, Raquel
description Los criterios k-NN son algoritmos no paramétricos de clasificación estadística. Son precisos, versátiles y libres de distirbución. Sin embargo su costo computacional puede ser demasiado alto; especialmente con tamaños de muestra grandes. Presentamos un nuevo algoritmo de condensación que, basado en el modelo Binormal para curvas ROC, permite transformar la base de entrenamiento en un conjunto pequeño de vectores de baja dimensión. A diferencia de otras técnicas escritas en la literatura, nuestra propuesta permite controlar el intercambio de precisión por reducción de la base de entrenamiento. Un estudio de Monte Carlo muestra que el desempeño del método popuesto puede ser muy competente, superando en diversos escenarios realistas al de otros métodos frecuentemente utilizados.
title Curvas ROC y vecinos cercanos, propuesta de un nuevo algoritmo de condensación
title_short Curvas ROC y vecinos cercanos, propuesta de un nuevo algoritmo de condensación
title_full Curvas ROC y vecinos cercanos, propuesta de un nuevo algoritmo de condensación
title_fullStr Curvas ROC y vecinos cercanos, propuesta de un nuevo algoritmo de condensación
title_full_unstemmed Curvas ROC y vecinos cercanos, propuesta de un nuevo algoritmo de condensación
title_sort curvas roc y vecinos cercanos, propuesta de un nuevo algoritmo de condensación
title_alt Curvas ROC y vecinos cercanos, propuesta de un nuevo algoritmo de condensación
publisher Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA)
publishDate 2011
url https://revistas.ucr.ac.cr/index.php/matematica/article/view/2112
work_keys_str_mv AT jimenezpadillaraquel curvasrocyvecinoscercanospropuestadeunnuevoalgoritmodecondensacion
AT cuevascovarrubiascarlos curvasrocyvecinoscercanospropuestadeunnuevoalgoritmodecondensacion
_version_ 1811744085164163072