Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones d...
Autores principales: | , , |
---|---|
Formato: | Online |
Idioma: | spa |
Publicado: |
Universidad Tecnológica de Panamá, Panamá
2018
|
Acceso en línea: | https://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807 |
id |
IDTEC1807 |
---|---|
record_format |
ojs |
spelling |
IDTEC18072019-04-26T14:59:06Z Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos Murillo, Danny Saavedra, Dalys Quintero, Erika El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. Además, con el fin de realizar un análisis más profundo, se creó un algoritmo en el lenguaje R para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada. Universidad Tecnológica de Panamá, Panamá 2018-06-11 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion application/pdf text/html https://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807 10.33412/idt.v14.1.1807 I+D Tecnológico; Vol. 14 Núm. 1 (2018): Revista de I+D Tecnológico; 94-104 2219-6714 1680-8894 spa https://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807/pdf https://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807/html Derechos de autor 2018 I+D Tecnológico http://creativecommons.org/licenses/by-nc-sa/4.0 |
institution |
Universidad Tecnológica de Panamá |
collection |
I+D Tecnológico |
language |
spa |
format |
Online |
author |
Murillo, Danny Saavedra, Dalys Quintero, Erika |
spellingShingle |
Murillo, Danny Saavedra, Dalys Quintero, Erika Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos |
author_facet |
Murillo, Danny Saavedra, Dalys Quintero, Erika |
author_sort |
Murillo, Danny |
description |
El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. Además, con el fin de realizar un análisis más profundo, se creó un algoritmo en el lenguaje R para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada. |
title |
Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos |
title_short |
Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos |
title_full |
Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos |
title_fullStr |
Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos |
title_full_unstemmed |
Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos |
title_sort |
extracción de datos de perfiles en google scholar utilizando un algoritmo en el lenguaje r para hacer minería de datos |
publisher |
Universidad Tecnológica de Panamá, Panamá |
publishDate |
2018 |
url |
https://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807 |
work_keys_str_mv |
AT murillodanny extracciondedatosdeperfilesengooglescholarutilizandounalgoritmoenellenguajerparahacermineriadedatos AT saavedradalys extracciondedatosdeperfilesengooglescholarutilizandounalgoritmoenellenguajerparahacermineriadedatos AT quinteroerika extracciondedatosdeperfilesengooglescholarutilizandounalgoritmoenellenguajerparahacermineriadedatos |
_version_ |
1811817967203123200 |