Los marcadores discursivos en el corpus español de la ONU
Llegamos por tanto a la etapa del reconocimiento y etiquetado de los marcadores discursivos en un texto de habla oral. Para la resolución de esta tarea debemos plantearnos cómo vamos a gestionar el problema de la ambigüedad de los marcadores discursivos, una ambigüedad que como ya hemos señalado anteriormente, puede ser categorial pero también discursiva, en el caso de que no hayamos podido resolver este problema a nivel teórico.
Nosotras hemos manejado el problema de la ambigüedad en el corpus español de la siguiente forma. Hemos dividido los marcadores discursivos en cuatro grupos:
- Marcadores no ambiguos. Ejemplo: Generalmente
- Marcadores con ambigüedad categorial. Ejemplo: Primero
- Marcadores con ambigüedad discursiva. Ejemplo: Como
- Marcadores con ambigüedad categorial y discursiva. Ejemplo: Bueno
Los marcadores de tipo 1 se reconocen y se etiquetan de forma automática. Para desambiguar los marcadores de tipo 2, hemos recurrido a reglas de desambiguación contextual basadas en información prosódica, en posición discursiva y en información categorial. Para los marcadores de tipo 3, hemos seleccionado el significado más frecuente, y luego se ha verificado a mano. Para los marcadores de tipo 4 hemos aplicado las estrategias del tipo 2 y 3 simultáneamente, y luego se han revisado a mano los errores. Una vez que el corpus se ha etiquetado, se ha validado su buena formación como documento XML a través de una DTD.
3.1 Fenómenos pragmáticos y marcadores discursivos en el corpus de la ONU
De 1179 oraciones que forman la parte española del corpus, el anotador automático ha reconocido y etiquetado ocurrencias de uno o más marcador discursivo en 411 oraciones. El número total de ocurrencias de marcadores discursivos en español es 558 representando 83 tipos diferentes según la materialización lingüística del marcador discursivo. Sin embargo, si consideramos la función discursiva, las 558 ocurrencias representan 92 marcadores discursivos. Estos datos reflejan la ambigüedad discursiva, ya que una sola forma lingüística puede desempeñar diferentes funciones discursivas.
Por otra parte, es momento de aclarar que, tal y como ya se ha encargado de señalar frecuentemente la bibliografía, no todas las relaciones discursivas se explicitan a través de marcadores discursivos. En este sentido, nos gustaría destacar el estudio de Maite Taboada en el que se analizaron dos corpus, uno de conversaciones y otro de artículos de periódico, sobre los que intentó proyectar el modelo SDRT de Mann y Thompson. Esta autora concluyó que entre el 60% y el 70% de las relaciones discursivas no estaban expresadas explícitamente a partir de una forma lingüística (Taboada 2006).
A continuación se expondrán qué marcadores discursivos en el corpus de la ONU han dado forma a estas relaciones, y cuáles son sus ocurrencias en el corpus.
3.2 Las relaciones argumentativas
La tipología de relaciones entre enunciados que nos hemos planteado aquí se encuadra dentro de la preocupación por hallar una relación entre las formas lingüísticas y los modos de razonar y de expresar el pensamiento. Como sabemos, por un lado, tenemos a un sector de las Ciencias Cognitivas (Gardner 1987) con J. Fodor a la cabeza, que fundamentalmente defiende la existencia de un lenguaje propio del pensamiento, con el que el pensamiento opera, diferente a los sistemas lingüísticos. Durante mucho tiempo se ha aspirado a dar cuenta del lenguaje del pensamiento mediante el lenguaje de la lógica. Pero, sin embargo, hay bastantes investigaciones en el terreno de Teoría del razonamiento que confirman que la lógica del sentido común con la cual la gente se comporta en su vida
diaria, es diferente a la lógica que ha cultivado en la Filosofía (Lengrezi,1998). Por su parte, dentro del panorama lingüístico la Pragmática y de la Semántica, los lingüistas han reflexionado sobre algunas equivalencias entre conectivas lógicas y conectivas lingüísticas, pero la comparación no ha dado buen resultado (Escandell 1993). De nuevo, las conclusiones han sido parecidas, el contenido importa, determina el tipo de razonamiento. Anscombre y Ducrot (1994) defienden en su Teoría de la Argumentación algo parecido; estos autores señalan que los enunciados están orientados a defender unas posiciones argumentativas u otras. Dentro de esta argumentación que se lleva a cabo cuando se habla, los marcadores discursivos juegan un papel clave a la hora de guiar las inferencias, entendiendo por inferencia, el razonamiento que se expresa a través de varios enunciados.
Nosotras vamos a utilizar en nuestra tipología tipos de operaciones que tienen una larga tradición de análisis en los estudios descriptivos sobre marcadores del discurso. En ella hemos distinguido las siguientes clases:
- Generalización y concreción.
- Coargumentación, contraargumentación y concesividad
- Hipótesis y condición
- Reformulación
- Síntesis
- Topicalización
- Causa, consecuencia, tiempo y finalidad
A continuación presentamos las tablas de frecuencia de marcadores discursivos asociados a la operación que están codificando.
Operación discursiva | Frecuencia total en marcadores usados | Marcadores discursivos | Frecuencia del marcador |
Generalización | 7 | En general | 7 |
Concreción | 47 | En particular | 19 |
Especialmente | 8 | ||
Como | 6 | ||
Particularmente | 5 | ||
Concretamente | 4 | ||
En concreto | 1 | ||
Tal como | 2 | ||
Por ejemplo | 2 | ||
Coargumentación | 224 | Y | 201 |
E | 20 | ||
En principio | 1 | ||
Incluso | 1 | ||
En primer lugar | 1 | ||
Coargumentación1 | 74 | también | 41 |
asimismo | 18 | ||
Además | 15 | ||
Coargumentación 2 | 2 | Por otra parte | 2 |
Coargumentación 3 | 5 | Finalmente | 3 |
Por último | 2 |
Contraargumentación | 22 | Pero | 16 |
Sin embargo | 2 | ||
No obstante | 2 | ||
Sino | 1 | ||
Mientras que | 1 | ||
Hipótesis/condición | 13 | Una vez que | 3 |
Si | 8 | ||
Siempre y cuando | 1 | ||
Sin que | 1 | ||
Causa | 5 | Porque | 1 |
Gracias a/al | 2 | ||
Debido a que | 1 | ||
Puesto que | 1 | ||
Consecuencia | 17 | Pues | 4 |
Por consiguiente | 3 | ||
En consecuencia | 3 | ||
Como resultado de | 2 | ||
De resultas de | 1 | ||
A consecuencias de ello | 1 | ||
Ya que | 1 | ||
Por ello | 1 | ||
Por cuanto | 1 | ||
Concesión | 13 | Aunque | 13 |
Reformulación | 5 | A saber | 4 |
Es decir | 1 | ||
Topicalización | 37 | Respecto de | 13 |
Con respecto a/al | 8 | ||
En cuanto a/al | 4 | ||
A este respecto | 3 | ||
A tal respecto | 2 | ||
Respecto del | 1 | ||
Desde el punto de vista x | 2 | ||
En relación con | 1 | ||
En este sentido | 2 | ||
En este contexto | 1 | ||
Síntesis | 1 | Principalmente | 1 |
Tiempo | 15 | Cuando | 7 |
Al mismo tiempo | 1 | ||
Al tiempo que | 2 | ||
Mientras | 1 | ||
Tan pronto como | 1 | ||
Desde que | 1 | ||
A la vez que | 1 | ||
Entre tanto | 1 | ||
Finalidad | 32 | Para que | 29 |
A fin de que | 2 |
A tal fin | 1 |
Otras operaciones discursivas son la digresión y la planificación del habla (apoyos vocálicos) pero no las vamos a tratar aquí por no aparecer en la ONU.
3.3 La modalización discursiva
La modalización discursiva ha sido objeto de estudio por parte de diferentes ramas del conocimiento, desde la Filosofía hasta la Pragmática. Nosotros entendemos la modalización como un proceso cognitivo. Cada ser humano posee un modelo de mundo. La modalización que se lleva a cabo durante el discurso puede estar motivada por la cognición y regulada por unas normas que conducen no solo a la comunicación sino al refuerzo de lazos de solidaridad, ya que también somos seres sociales. Por ello, el ser humano puede atenuar la verdad de sus enunciados bien porque no esté seguro de dicho valor de verdad, bien porque intenta buscar acuerdo con su interlocutor. De la misma forma, la intensificación del discurso puede estar causada por un compromiso total con la verdad de los enunciados que se está verbalizando, o puede estar causada por la intención de intensificar el acuerdo y por tanto las relaciones sociales con el interlocutor.
Por otra parte, dentro de las operaciones de modalización discursiva nos gustaría diferenciar un tipo más, el tercero y el último: la interacción. Durante el proceso de interacción, hay formas lingüísticas que cumplen la función de buscar o bien acuerdo o bien necesidad de saber si el mensaje está siendo interpretado en el sentido en que al hablante le gustaría; ejemplos de estos marcadores son ¿eh? ¿no? ¿entiendes?¿sabes? ¿me explico o no me explico?.
Modalización | Intensificación | 2 | Verdaderamente | 1 |
Atenuación | Posiblemente | 1 |
3.4 La evidencialidad
Como ya se ha explicado, a través de estos marcadores se marca lingüísticamente la fuente del conocimiento.
Como sabemos hay una relación entre evidencialidad y la modalidad. La expresión de evidencialidad tiene un valor argumentativo, una autoridad en el juicio sobre el valor de verdad del enunciado. Así por ejemplo, un marcador como por lo visto tendría un contenido evidencial pero también un contenido atenuante, ya que con dicho marcador el hablante se distancia del valor de verdad de su enunciado, atenuando la verdad del mismo.
Nosotras hemos diferenciado las siguientes fuentes de conocimiento: (1) vista (2) otros sentidos (3) inferencia lógica (4) testimonio de otro (5) fuente oral (6) fuente escrita. En el futuro, la Antropología y la Sociología deben colaborar con la Lingüística para jerarquizar las fuentes en función de la autoridad que cada una de ellas tiene en cada cultura. Nosotros no hemos establecido una jerarquía entre ellas. Solamente etiquetamos las expresiones que aluden a estos tipos. Los marcadores de evidencialidad en el corpus de la ONU son:
Evidencialidad | 4 | aparentemente | 1 |
Relativamente | 1 | ||
A juicio de ellos | 1 | ||
En su opinión | 1 |
3.5. Deixis: El término de deixis se utiliza para denominar a las formas lingüísticas cuya referencia depende del contexto. En este sentido, hemos diferenciado dos tipos de maracadores deícticos: aquellos que hacen referencia a partes del texto y aquellos que hacen referencia al interlocutor. Aunque en este corpus solo hayamos encontrado el primer tipo.
Deixis | textual | De esta forma | 1 |
Add Comment