Generación de reglas estadísticas a partir de grandes bases de datos

Dado un conjunto de variables cualitativas, queremos predecir una o varias de ellas mediante reglas. Proponemos un algoritmo que (i) es guiado por resultados estadísticos en el marco de una geometría relacional, dentro de la cual se utilizan índices de asociación disimétricos, y (ii) efectúa aproxim...

Descripción completa

Detalles Bibliográficos
Autores principales: Schektman, Yves, Trejos Zelaya, Javier, Troupé, Marylène
Formato: Online
Idioma:spa
Publicado: Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA) 1994
Acceso en línea:https://revistas.ucr.ac.cr/index.php/matematica/article/view/106
id RMTA106
record_format ojs
spelling RMTA1062022-01-12T15:54:55Z Generación de reglas estadísticas a partir de grandes bases de datos Generación de reglas estadísticas a partir de grandes bases de datos Schektman, Yves Trejos Zelaya, Javier Troupé, Marylène Given a set of categorical variables, we want to predict one or more of them by the way rules. We propose an algorithm that (i) is guided by statistical results in a relational geometry where we use assymetrical association indices, and (ii) makes statistical and euclidian approximations. The iterative method we propose can obtain rules without introducing a priori their premises in the set of independent conjonctions analized by the generator at each step. The algorithm has a linear complexity with regard to the number of individual; this property makes it suitable for large data sets. We present results over data examples. Dado un conjunto de variables cualitativas, queremos predecir una o varias de ellas mediante reglas. Proponemos un algoritmo que (i) es guiado por resultados estadísticos en el marco de una geometría relacional, dentro de la cual se utilizan índices de asociación disimétricos, y (ii) efectúa aproximaciones estadísticas y euclidianas. El método iterativo propuesto puede obtener muchas reglas sin tener que introducir a priori sus premisas en el conjunto de conjunciones explicativas que el generador analiza en cada etapa. El algoritmo es de complejidad lineal respecto al número de individuos, por lo que sería particularmente bien adaptado a las grandes bases de datos. Se presentan resultados sobre ejemplos de datos.Palabras clave: reglas de producción, asociación disimétrica, adquisición de conocimientos, distancia relacional, número equivalente. Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA) 1994-02-01 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Article application/pdf https://revistas.ucr.ac.cr/index.php/matematica/article/view/106 10.15517/rmta.v1i1.106 Revista de Matemática: Teoría y Aplicaciones; Vol. 1 No. 1 (1994): Revista de Matemática: Teoría y Aplicaciones; 87-100 Revista de Matemática: Teoría y Aplicaciones; Vol. 1 Núm. 1 (1994): Revista de Matemática: Teoría y Aplicaciones; 87-100 Revista de Matemática; Vol. 1 N.º 1 (1994): Revista de Matemática: Teoría y Aplicaciones; 87-100 2215-3373 1409-2433 spa https://revistas.ucr.ac.cr/index.php/matematica/article/view/106/86 Derechos de autor 1994 Revista de Matemática: Teoría y Aplicaciones
institution Universidad de Costa Rica
collection Revista de Matemática: Teoría y Aplicaciones
language spa
format Online
author Schektman, Yves
Trejos Zelaya, Javier
Troupé, Marylène
spellingShingle Schektman, Yves
Trejos Zelaya, Javier
Troupé, Marylène
Generación de reglas estadísticas a partir de grandes bases de datos
author_facet Schektman, Yves
Trejos Zelaya, Javier
Troupé, Marylène
author_sort Schektman, Yves
description Dado un conjunto de variables cualitativas, queremos predecir una o varias de ellas mediante reglas. Proponemos un algoritmo que (i) es guiado por resultados estadísticos en el marco de una geometría relacional, dentro de la cual se utilizan índices de asociación disimétricos, y (ii) efectúa aproximaciones estadísticas y euclidianas. El método iterativo propuesto puede obtener muchas reglas sin tener que introducir a priori sus premisas en el conjunto de conjunciones explicativas que el generador analiza en cada etapa. El algoritmo es de complejidad lineal respecto al número de individuos, por lo que sería particularmente bien adaptado a las grandes bases de datos. Se presentan resultados sobre ejemplos de datos.Palabras clave: reglas de producción, asociación disimétrica, adquisición de conocimientos, distancia relacional, número equivalente.
title Generación de reglas estadísticas a partir de grandes bases de datos
title_short Generación de reglas estadísticas a partir de grandes bases de datos
title_full Generación de reglas estadísticas a partir de grandes bases de datos
title_fullStr Generación de reglas estadísticas a partir de grandes bases de datos
title_full_unstemmed Generación de reglas estadísticas a partir de grandes bases de datos
title_sort generación de reglas estadísticas a partir de grandes bases de datos
title_alt Generación de reglas estadísticas a partir de grandes bases de datos
publisher Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA)
publishDate 1994
url https://revistas.ucr.ac.cr/index.php/matematica/article/view/106
work_keys_str_mv AT schektmanyves generaciondereglasestadisticasapartirdegrandesbasesdedatos
AT trejoszelayajavier generaciondereglasestadisticasapartirdegrandesbasesdedatos
AT troupemarylene generaciondereglasestadisticasapartirdegrandesbasesdedatos
_version_ 1811744045543718912