Después de haber explicado las aportaciones teóricas más relevantes entorno al significado, función y dimensiones de análisis de esta categoría pragmática, nos gustaría introducir al lector, para finalizar este capítulo, en la aplicación que de este conocimiento se ha llevado a cabo en el mundo de la Lingüística Computacional (LC) y de la Inteligencia Artificial (IA).
Junto con las marcas superficiales de los textos, los marcadores del discurso son considerados por parte de la LC de la siguiente manera: The most important instruments are cue words specifically employed to signal the particular relationship between text spans . Estas marcas resultan muy útiles para tareas de procesamiento de lenguaje natural (PLN) complejas de amplia cobertura, ya que aportan información muy rica sobre la estructura discursiva, con un bajo coste de procesamiento .
A continuación, enumeramos los campos de investigación en LC que se centran en estas partículas :
- Identificación automática de la estructura discursiva de un texto. La unidad fraseológica utilizada para esta parte de la LC en inglés es discourse structure parsing.
- Reconocimiento y generación de marcadores del discurso.
- La interrelación entre la estructura del discurso y otros niveles de la gramática.
- El análisis y la representación formal tanto de las relaciones del discurso como de sus piezas léxicas.
- El estudio de las palabras que funcionan como marcadores del discurso en la oralidad.
Las aplicaciones de este conocimiento a la LC son:
- Resolución de co-referencia.
- Gestión de diálogos.
- Resumen automático.
- Identificación de relaciones de relevancia y coherencia.
- Segmentación discursiva de los textos.
- Derivación de estructura discursiva.
En el panorama internacional, nos gustaría señalar dos investigaciones de gran relevancia en materia de marcadores del discurso. La primera de ellas, de carácter básica, es la creación de un recurso lingüístico, un diccionario de marcadores del discurso, que se emplea a la hora de señalar la presencia de una relación discursiva entre spans adjacentes de texto . En segundo lugar, destacaremos las investigaciones de D. Marcu. Este investigador ha diseñado dos algoritmos para derivar la estructura retórica de un texto. Por esto último se entiende la creación de un programa de ordenador que haría el análisis estructural de un texto, igual que los que hacen análisis sintáctico de las oraciones. El primer algoritmo identifica los marcadores discursivos en un texto y lo divide en oraciones; el segundo produce un árbol con la estructura retórica del texto. Estos algoritmos han sido diseñados para textos no restrictivos, esto es, para cualquier tipo de textos independientemente de su dominio contextual .
En lo que respecta a las investigaciones en materia computacional en el ámbito hispano, destacaremos las investigaciones de Laura Alonso ( y ) a la hora de crear un lexicón computacional de marcadores y de usarlos en la identificación de estructura textual de cara al resumen automático de textos.
L. Alonso presenta para el resumen automático un marco y una metodología de trabajo para representar el discurso con técnicas de procesamiento de lenguaje natural. Por una lado, posee:
- Un modelo de representación de la estructura del discurso
- Un inventario de significados de relaciones discursivas 7
- Un modo de relacionar las pistas superficiales de texto (como la puntuación) con los significados discursivos.
Por otro lado, los recursos con los que cuenta son:
- Un corpus anotado (aunque no especifica en sus trabajos en qué niveles).
- Un lexicón de marcadores discursivos.
- Algoritmos para la segmentación del discurso con información varia (tampoco especifica cual).
- Una herramienta para la extracción automática de marcadores del discurso en corpus sin ningún tipo de tratamiento que ha denominado MDs X-TRACTOR .
Para resumir, L. Alonso parte de pistas superficiales en el discurso como la puntuación, la estructura sintáctica superficial y los marcadores discursivos y los asocia a significados discursivos. El inventario de dichos significados discursivos es el siguiente: dimensión estructural, continuación, elaboración, dimensión semántica, revisión, causalidad, igualdad, contexto y discurso .
Una vez presentadas brevemente el estado de la cuestión en esta materia, pasemos ahora a comentar algunas deficiencias teóricas en los planteamientos computacionales. En este capítulo, solo trataremos los problemas derivados de la equivalencia entre relaciones de coherencia, relaciones retóricas y marcadores del discurso de la que se parte en buena parte de los trabajos de LC, y que ya está comenzando a ser criticada por investigadores de este mismo sector ; mientras que dejaremos las críticas relacionadas con la identificación y clasificación de marcadores del discurso de manera manual y automática para los capítulos cinco y siete.
Add Comment