Generación de reglas estadísticas a partir de grandes bases de datos
Dado un conjunto de variables cualitativas, queremos predecir una o varias de ellas mediante reglas. Proponemos un algoritmo que (i) es guiado por resultados estadísticos en el marco de una geometría relacional, dentro de la cual se utilizan índices de asociación disimétricos, y (ii) efectúa aproxim...
Autores principales: | , , |
---|---|
Formato: | Online |
Idioma: | spa |
Publicado: |
Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA)
1994
|
Acceso en línea: | https://revistas.ucr.ac.cr/index.php/matematica/article/view/106 |
id |
RMTA106 |
---|---|
record_format |
ojs |
spelling |
RMTA1062022-01-12T15:54:55Z Generación de reglas estadísticas a partir de grandes bases de datos Generación de reglas estadísticas a partir de grandes bases de datos Schektman, Yves Trejos Zelaya, Javier Troupé, Marylène Given a set of categorical variables, we want to predict one or more of them by the way rules. We propose an algorithm that (i) is guided by statistical results in a relational geometry where we use assymetrical association indices, and (ii) makes statistical and euclidian approximations. The iterative method we propose can obtain rules without introducing a priori their premises in the set of independent conjonctions analized by the generator at each step. The algorithm has a linear complexity with regard to the number of individual; this property makes it suitable for large data sets. We present results over data examples. Dado un conjunto de variables cualitativas, queremos predecir una o varias de ellas mediante reglas. Proponemos un algoritmo que (i) es guiado por resultados estadísticos en el marco de una geometría relacional, dentro de la cual se utilizan índices de asociación disimétricos, y (ii) efectúa aproximaciones estadísticas y euclidianas. El método iterativo propuesto puede obtener muchas reglas sin tener que introducir a priori sus premisas en el conjunto de conjunciones explicativas que el generador analiza en cada etapa. El algoritmo es de complejidad lineal respecto al número de individuos, por lo que sería particularmente bien adaptado a las grandes bases de datos. Se presentan resultados sobre ejemplos de datos.Palabras clave: reglas de producción, asociación disimétrica, adquisición de conocimientos, distancia relacional, número equivalente. Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA) 1994-02-01 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Article application/pdf https://revistas.ucr.ac.cr/index.php/matematica/article/view/106 10.15517/rmta.v1i1.106 Revista de Matemática: Teoría y Aplicaciones; Vol. 1 No. 1 (1994): Revista de Matemática: Teoría y Aplicaciones; 87-100 Revista de Matemática: Teoría y Aplicaciones; Vol. 1 Núm. 1 (1994): Revista de Matemática: Teoría y Aplicaciones; 87-100 Revista de Matemática; Vol. 1 N.º 1 (1994): Revista de Matemática: Teoría y Aplicaciones; 87-100 2215-3373 1409-2433 spa https://revistas.ucr.ac.cr/index.php/matematica/article/view/106/86 Derechos de autor 1994 Revista de Matemática: Teoría y Aplicaciones |
institution |
Universidad de Costa Rica |
collection |
Revista de Matemática: Teoría y Aplicaciones |
language |
spa |
format |
Online |
author |
Schektman, Yves Trejos Zelaya, Javier Troupé, Marylène |
spellingShingle |
Schektman, Yves Trejos Zelaya, Javier Troupé, Marylène Generación de reglas estadísticas a partir de grandes bases de datos |
author_facet |
Schektman, Yves Trejos Zelaya, Javier Troupé, Marylène |
author_sort |
Schektman, Yves |
description |
Dado un conjunto de variables cualitativas, queremos predecir una o varias de ellas mediante reglas. Proponemos un algoritmo que (i) es guiado por resultados estadísticos en el marco de una geometría relacional, dentro de la cual se utilizan índices de asociación disimétricos, y (ii) efectúa aproximaciones estadísticas y euclidianas. El método iterativo propuesto puede obtener muchas reglas sin tener que introducir a priori sus premisas en el conjunto de conjunciones explicativas que el generador analiza en cada etapa. El algoritmo es de complejidad lineal respecto al número de individuos, por lo que sería particularmente bien adaptado a las grandes bases de datos. Se presentan resultados sobre ejemplos de datos.Palabras clave: reglas de producción, asociación disimétrica, adquisición de conocimientos, distancia relacional, número equivalente. |
title |
Generación de reglas estadísticas a partir de grandes bases de datos |
title_short |
Generación de reglas estadísticas a partir de grandes bases de datos |
title_full |
Generación de reglas estadísticas a partir de grandes bases de datos |
title_fullStr |
Generación de reglas estadísticas a partir de grandes bases de datos |
title_full_unstemmed |
Generación de reglas estadísticas a partir de grandes bases de datos |
title_sort |
generación de reglas estadísticas a partir de grandes bases de datos |
title_alt |
Generación de reglas estadísticas a partir de grandes bases de datos |
publisher |
Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA) |
publishDate |
1994 |
url |
https://revistas.ucr.ac.cr/index.php/matematica/article/view/106 |
work_keys_str_mv |
AT schektmanyves generaciondereglasestadisticasapartirdegrandesbasesdedatos AT trejoszelayajavier generaciondereglasestadisticasapartirdegrandesbasesdedatos AT troupemarylene generaciondereglasestadisticasapartirdegrandesbasesdedatos |
_version_ |
1811744045543718912 |