Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos

La minería y explotación de datos contenidos en las redes sociales no solo ha sido foco de múltiples esfuer- zos, sino que a pesar de los recursos y energía invertidos aún queda mucho por hacer dada su complejidad. Concretamente, el contenido de los textos publicados regularmente, en los sitios...

Descripción completa

Detalles Bibliográficos
Autores principales: Quesada Grosso, Minor, Casasola Murillo, Édgar, Leoni de León, Antonio
Formato: Online
Idioma:spa
Publicado: Universidad de Costa Rica. Campus Rodrigo Facio. Sitio web: https://www.ucr.ac.cr/ Teléfono: (506) 2511-4000. Correo de soporte: revistas@ucr.ac.cr 2017
Acceso en línea:https://revistas.ucr.ac.cr/index.php/kanina/article/view/30224
id KANINA30224
record_format ojs
spelling KANINA302242022-05-31T02:51:59Z Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos Quesada Grosso, Minor Casasola Murillo, Édgar Leoni de León, Antonio Temas emergentes modelos de temas detección de tendencias redes sociales procesamiento de leguaje temporal La minería y explotación de datos contenidos en las redes sociales no solo ha sido foco de múltiples esfuer- zos, sino que a pesar de los recursos y energía invertidos aún queda mucho por hacer dada su complejidad. Concretamente, el contenido de los textos publicados regularmente, en los sitios de microblogs (por ejemplo, en Twitter.com) puede ser utilizado para analizar tendencias. Estas últimas son marcadas por temas emergen- tes que se distinguen de los demás por un súbito y acelerado aumento de popularidad en periodos relativamen- te cortos, de un día o de unas cuantas horas. De este modo, el problema es extraer los temas sobre los cuáles se escribe e identificar cuáles de ellos son emergentes. Una solución reciente, conocida como Bursty Biterm Topic Model (BBTM) es un algoritmo que utiliza coocurrencias de palabras (bitérminos) para la identificación de temas emergentes y cuenta con un buen nivel de resultados en Twitter. Sin embargo, toma en cuenta todas las palabras, aún aquellas que no representan temas emergentes y por lo tanto, son menos útiles para identificar- los. De ahí, que esta investigación busca hacer una exploración inicial de la aplicación de una discriminación de los bitérminos utilizados por BBTM para modelar los temas emergentes.  Universidad de Costa Rica. Campus Rodrigo Facio. Sitio web: https://www.ucr.ac.cr/ Teléfono: (506) 2511-4000. Correo de soporte: revistas@ucr.ac.cr 2017-08-16 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Article Article application/pdf https://revistas.ucr.ac.cr/index.php/kanina/article/view/30224 10.15517/rk.v40i4.30224 Káñina; Vol. 40 No. 4 (2016): Káñina número extraordinario; 33-47 Káñina; Vol. 40 Núm. 4 (2016): Káñina número extraordinario; 33-47 Káñina; Vol. 40 N.º 4 (2016): Káñina número extraordinario; 33-47 2215-2636 0378-0473 spa https://revistas.ucr.ac.cr/index.php/kanina/article/view/30224/30204 Derechos de autor 2017 Káñina
institution Universidad de Costa Rica
collection Káñina
language spa
format Online
author Quesada Grosso, Minor
Casasola Murillo, Édgar
Leoni de León, Antonio
spellingShingle Quesada Grosso, Minor
Casasola Murillo, Édgar
Leoni de León, Antonio
Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos
author_facet Quesada Grosso, Minor
Casasola Murillo, Édgar
Leoni de León, Antonio
author_sort Quesada Grosso, Minor
description La minería y explotación de datos contenidos en las redes sociales no solo ha sido foco de múltiples esfuer- zos, sino que a pesar de los recursos y energía invertidos aún queda mucho por hacer dada su complejidad. Concretamente, el contenido de los textos publicados regularmente, en los sitios de microblogs (por ejemplo, en Twitter.com) puede ser utilizado para analizar tendencias. Estas últimas son marcadas por temas emergen- tes que se distinguen de los demás por un súbito y acelerado aumento de popularidad en periodos relativamen- te cortos, de un día o de unas cuantas horas. De este modo, el problema es extraer los temas sobre los cuáles se escribe e identificar cuáles de ellos son emergentes. Una solución reciente, conocida como Bursty Biterm Topic Model (BBTM) es un algoritmo que utiliza coocurrencias de palabras (bitérminos) para la identificación de temas emergentes y cuenta con un buen nivel de resultados en Twitter. Sin embargo, toma en cuenta todas las palabras, aún aquellas que no representan temas emergentes y por lo tanto, son menos útiles para identificar- los. De ahí, que esta investigación busca hacer una exploración inicial de la aplicación de una discriminación de los bitérminos utilizados por BBTM para modelar los temas emergentes. 
title Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos
title_short Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos
title_full Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos
title_fullStr Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos
title_full_unstemmed Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos
title_sort extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos
publisher Universidad de Costa Rica. Campus Rodrigo Facio. Sitio web: https://www.ucr.ac.cr/ Teléfono: (506) 2511-4000. Correo de soporte: revistas@ucr.ac.cr
publishDate 2017
url https://revistas.ucr.ac.cr/index.php/kanina/article/view/30224
work_keys_str_mv AT quesadagrossominor extracciondetemasemergentesenmicroblogsutilizandomodelosdetemasydiscriminaciondebiterminos
AT casasolamurilloedgar extracciondetemasemergentesenmicroblogsutilizandomodelosdetemasydiscriminaciondebiterminos
AT leonideleonantonio extracciondetemasemergentesenmicroblogsutilizandomodelosdetemasydiscriminaciondebiterminos
_version_ 1810112809079406592