La anotación del corpus C-ORAL-ROM: niveles de anotación y formatos
C-ORAL-ROM consta de cuatro versiones del corpus cada una con diferentes niveles de etiquetado. La primera es en formato texto y refleja el sistema de transcripción hasta aquí mostrado. La segunda muestra en XML las marcas de alineamiento con el sonido de la grabación. Después hay una versión de C-ORAL-ROM – en formato MULTEXT y
Read moreLas transcripciones
En la tabla siguiente se recogen los signos de transcripción más importantes para la comprensión de las transcripciones: |p1cm|p7cm|p7cm| Signo & Definición & Ejemplo * Tres mayúsculas: & Comienzo de turno. Las siglas coincidirán con la que se les ha asignado al interlocutor en la cabecera & *ABC: *XZY: & En caso de que no
Read moreLas cabeceras de las transcripciones
En la cabecera se recoge información de naturaleza contextual clasificada en los siguientes campos:@Title: un breve título@File: el nombre del archivo@Participants: los datos sobre los participantes @Date: la fecha@Place: la ciudad donde se produjo la grabación@Situation: la situación@Topic: el tema o subtemas que se tratan@Source: el origen del texto@Class: el tipo según las distinciones de
Read moreEl corpus oral del español C-ORAL-ROM: diseño y características
El corpus C-ORAL-ROM tiene aproximadamente unas 300.000 palabras. Desde un punto de vista macroestructural, en las transcripciones podemos diferenciar dos grandes bloques: la cabecera y la transcripción propiamente dicha del sonido de la grabación. A continuación explicaremos las características más importantes de cada uno de estos bloques en sendos subapartados.
Read moreC-ORAL-ROM en la tradición lingüística de corpus orales
La Lingüística de Corpus y los Estudios sobre la Lengua Oral son disciplinas independientes, pero estrechamente relacionadas entre sí, que en las últimas décadas del siglo XX lograron finalmente establecerse como líneas de investigación oficiales y consolidadas a nivel institucional dentro de la Lingüística. Tal y como señala, F. Sánchez, atrás quedan los debates del pasado sobre la utilidad
Read moreLingüística de corpus y anotacion pragmática: C-ORAL-ROM y Pragmatext: intro
Este capítulo está dedicado a enmarcar nuestro trabajo dentro de la disciplina de Lingüística de Corpus. Hemos dividido la exposición de los conocimientos en tres grandes partes. En la primera, presentamos las características de diseño más interesantes del corpus con el que vamos a trabajar, al tiempo que lo insertamos dentro las líneas de investigación
Read moreFinal del capítulo 5
Aquí termina la clasificación de las unidades con información pragmática de C-ORAL-ROM. Para un estudioso de la Pragmática dicha clasificación no va a ser suficiente e incluso puede llegar a considerar simplista; sin embargo es bastante rica en relación a lo que se ha hecho hasta el momento en Lingüística Computacional en lo que respecta
Read moreMarcadores de Actos de Habla etiquetados con PRAGMATEXT
MOSTRAMOS UN EJEMPLO DE LOS DATOS. PARA ACCEDER A ESTA INFORMACIÓN, CONTACTA CON LA AUTORA EN LA PÁGINA DE CONTACTO. MD UFS MET SD TD DR ED MOD EVI SA DEX verás No Sí No No No No No No Commitment Social Interlocutor que en paz descanse Col No No No No No No No
Read moreMarcadores de Deixis etiquetados con Pragmatext
PARA ACCEDER A ESTA INFORMACIÓN, CONTACTA CON LA AUTORA EN LA PÁGINA DE CONTACTO.
Read moreLos marcadores del discurso de C-ORAL-ROM clasificados con PRAGMATEXT: marcadores de modalización discursiva, atenuantes e intensificadores
SI ESTÁS INTERESADO EN ESTA INFORMACIÓN, PONTE EN CONTACTO CON LA AUTORA.
Read more