La anotación del corpus C-ORAL-ROM: niveles de anotación y formatos
C-ORAL-ROM consta de cuatro versiones del corpus cada una con diferentes niveles de etiquetado. La primera es en formato texto y refleja el sistema de transcripción hasta aquí mostrado. La segunda muestra en XML las marcas de alineamiento con el sonido de la grabación. Después hay una versión de C-ORAL-ROM – en formato MULTEXT y
Read more