Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos
La minería y explotación de datos contenidos en las redes sociales no solo ha sido foco de múltiples esfuer- zos, sino que a pesar de los recursos y energía invertidos aún queda mucho por hacer dada su complejidad. Concretamente, el contenido de los textos publicados regularmente, en los sitios...
Autores principales: | , , |
---|---|
Formato: | Online |
Idioma: | spa |
Publicado: |
Universidad de Costa Rica. Campus Rodrigo Facio. Sitio web: https://www.ucr.ac.cr/ Teléfono: (506) 2511-4000. Correo de soporte: revistas@ucr.ac.cr
2017
|
Acceso en línea: | https://revistas.ucr.ac.cr/index.php/kanina/article/view/30224 |
id |
KANINA30224 |
---|---|
record_format |
ojs |
spelling |
KANINA302242022-05-31T02:51:59Z Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos Quesada Grosso, Minor Casasola Murillo, Édgar Leoni de León, Antonio Temas emergentes modelos de temas detección de tendencias redes sociales procesamiento de leguaje temporal La minería y explotación de datos contenidos en las redes sociales no solo ha sido foco de múltiples esfuer- zos, sino que a pesar de los recursos y energía invertidos aún queda mucho por hacer dada su complejidad. Concretamente, el contenido de los textos publicados regularmente, en los sitios de microblogs (por ejemplo, en Twitter.com) puede ser utilizado para analizar tendencias. Estas últimas son marcadas por temas emergen- tes que se distinguen de los demás por un súbito y acelerado aumento de popularidad en periodos relativamen- te cortos, de un día o de unas cuantas horas. De este modo, el problema es extraer los temas sobre los cuáles se escribe e identificar cuáles de ellos son emergentes. Una solución reciente, conocida como Bursty Biterm Topic Model (BBTM) es un algoritmo que utiliza coocurrencias de palabras (bitérminos) para la identificación de temas emergentes y cuenta con un buen nivel de resultados en Twitter. Sin embargo, toma en cuenta todas las palabras, aún aquellas que no representan temas emergentes y por lo tanto, son menos útiles para identificar- los. De ahí, que esta investigación busca hacer una exploración inicial de la aplicación de una discriminación de los bitérminos utilizados por BBTM para modelar los temas emergentes. Universidad de Costa Rica. Campus Rodrigo Facio. Sitio web: https://www.ucr.ac.cr/ Teléfono: (506) 2511-4000. Correo de soporte: revistas@ucr.ac.cr 2017-08-16 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Article Article application/pdf https://revistas.ucr.ac.cr/index.php/kanina/article/view/30224 10.15517/rk.v40i4.30224 Káñina; Vol. 40 No. 4 (2016): Káñina número extraordinario; 33-47 Káñina; Vol. 40 Núm. 4 (2016): Káñina número extraordinario; 33-47 Káñina; Vol. 40 N.º 4 (2016): Káñina número extraordinario; 33-47 2215-2636 0378-0473 spa https://revistas.ucr.ac.cr/index.php/kanina/article/view/30224/30204 Derechos de autor 2017 Káñina |
institution |
Universidad de Costa Rica |
collection |
Káñina |
language |
spa |
format |
Online |
author |
Quesada Grosso, Minor Casasola Murillo, Édgar Leoni de León, Antonio |
spellingShingle |
Quesada Grosso, Minor Casasola Murillo, Édgar Leoni de León, Antonio Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos |
author_facet |
Quesada Grosso, Minor Casasola Murillo, Édgar Leoni de León, Antonio |
author_sort |
Quesada Grosso, Minor |
description |
La minería y explotación de datos contenidos en las redes sociales no solo ha sido foco de múltiples esfuer- zos, sino que a pesar de los recursos y energía invertidos aún queda mucho por hacer dada su complejidad. Concretamente, el contenido de los textos publicados regularmente, en los sitios de microblogs (por ejemplo, en Twitter.com) puede ser utilizado para analizar tendencias. Estas últimas son marcadas por temas emergen- tes que se distinguen de los demás por un súbito y acelerado aumento de popularidad en periodos relativamen- te cortos, de un día o de unas cuantas horas. De este modo, el problema es extraer los temas sobre los cuáles se escribe e identificar cuáles de ellos son emergentes. Una solución reciente, conocida como Bursty Biterm Topic Model (BBTM) es un algoritmo que utiliza coocurrencias de palabras (bitérminos) para la identificación de temas emergentes y cuenta con un buen nivel de resultados en Twitter. Sin embargo, toma en cuenta todas las palabras, aún aquellas que no representan temas emergentes y por lo tanto, son menos útiles para identificar- los. De ahí, que esta investigación busca hacer una exploración inicial de la aplicación de una discriminación de los bitérminos utilizados por BBTM para modelar los temas emergentes. |
title |
Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos |
title_short |
Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos |
title_full |
Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos |
title_fullStr |
Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos |
title_full_unstemmed |
Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos |
title_sort |
extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos |
publisher |
Universidad de Costa Rica. Campus Rodrigo Facio. Sitio web: https://www.ucr.ac.cr/ Teléfono: (506) 2511-4000. Correo de soporte: revistas@ucr.ac.cr |
publishDate |
2017 |
url |
https://revistas.ucr.ac.cr/index.php/kanina/article/view/30224 |
work_keys_str_mv |
AT quesadagrossominor extracciondetemasemergentesenmicroblogsutilizandomodelosdetemasydiscriminaciondebiterminos AT casasolamurilloedgar extracciondetemasemergentesenmicroblogsutilizandomodelosdetemasydiscriminaciondebiterminos AT leonideleonantonio extracciondetemasemergentesenmicroblogsutilizandomodelosdetemasydiscriminaciondebiterminos |
_version_ |
1810112809079406592 |