Automatización del análisis sintáctico para el español con el fin de crear in treebank estandarizado

El crecimiento exponencial en la creación de documentos en la Internet, escritos en español, ofrece variadas oportunidades para el análisis de texto. Debido a su cantidad creciente y a la escasez de herramientas que colaboren en estos procesos, se hace imprescindible la creación de herramientas...

Full description

Bibliographic Details
Main Authors: Sandí Salazar, Minor, Marín Raventós, Gabriela, Casasola Murillo, Edgar
Format: Online
Language:spa
Published: Universidad de Costa Rica. Campus Rodrigo Facio. Sitio web: https://www.ucr.ac.cr/ Teléfono: (506) 2511-4000. Correo de soporte: revistas@ucr.ac.cr 2017
Online Access:https://revistas.ucr.ac.cr/index.php/kanina/article/view/30232
Description
Summary:El crecimiento exponencial en la creación de documentos en la Internet, escritos en español, ofrece variadas oportunidades para el análisis de texto. Debido a su cantidad creciente y a la escasez de herramientas que colaboren en estos procesos, se hace imprescindible la creación de herramientas que los automaticen. Entre estas herramientas los treebanks ocupan un papel destacado, puesto que proveen información clave para muchos de los procesos de análisis. Actualmente, existe una tendencia que intenta estandarizar el etiquetado morfológico y sintáctico para crear puntos de contacto entre treebanks de distintas investigaciones. A partir de los antecedentes relacionados con el análisis sintáctico de textos, esta investigación propone una metodo- logía para determinar hasta dónde es posible automatizar el proceso de creación de treebanks, limitándose a la lengua española.