Vai ai contenuti.

LABLITA

Sezioni
Strumenti personali
Sei qui: Portale » Corpora e Risorse » Corpora e Risorse » C-Or-DiAL

C-Or-DiAL. Corpus Oral Didáctico Anotado Lingüísticamente

Carlota Nicolás Martínez

Go to corpus distribution / Acceso a las sesiones de C-Or-DiAL


C-Or-DiAL es un corpus de la lengua oral diseñado para la enseñanza e investigación.
El objetivo de esta publicación es compartir con la comunidad científica este corpus para la investigación lingüística y didáctica y también para su uso como recurso para la enseñanza. El material lingüístico que forma parte de este corpus es una muestra de la realidad lingüística del español.
El uso del corpus para el aprendizaje de la lengua aproxima al estudioso y al estudiante a la lengua en sus manifestaciones no artificiosas, ni condicionadas puesto que un corpus lingüístico es una muestra que representa una parcela auténtica de lengua.
Se ofrece su uso como recurso para la enseñanza pues la utilización de un corpus oral espontáneo para el aprendizaje de la lengua podría superar las deficiencias didácticas del uso del habla no real, y facilita el aprendizaje de la comprensión y expresión correcta del habla. Es decir, el habla espontánea que contiene C-Or-DiAL lleva a los estudiantes de ELE a afrontar escollos que existen en el habla y que suelen ser escamoteadas en los manuales con diálogos ficticios.
Deudor de Corlec, Corpus de Referencia de la Lengua Española Contemporánea, y de C-ORAL-ROM, Integrated reference corpora for spoken romance languages, C-Or-DiAL se empieza a realizar en el año 2004.
Los estudios que se hacen del corpus y los principios sobre los que se basa proceden de la Teoria della lingua in atto, del grupo de Lablita (Laboratorio de Lingüística Italiana, Univ. Florencia).

C-Or-DiAL contiene 240 sesiones que corresponden a un total de 15:58:56 horas de grabaciones transcritas son 118.756 palabras.
Cada sesión está compuesta por:

  • 240 grabaciones espontáneas, hechas en su mayoría sin conocimiento previo del hablante que ha dado su permiso posteriormente; grabadas en Madrid y con hablantes madrileños;
  • 240 transcripciones ortográficas con un minucioso etiquetado de las unidades prosódicas y de otros rasgos propios de la elocución como las reformulaciones, los apoyos vocálicos, etc., basado en las etiquetas utilizadas en C-Oral-Rom; también se han anotado las funciones comunicativas presentes en cada texto, tomando como referencia una lista reducida de estas funciones descritas en el Plan Curricular del Instituto Cervantes;
  • 240 cabeceras con los metadatos que preceden a cada transcripción son:
    • generales
      • los datos sobre los hablantes y su relación
      • la duración y número de palabras
      • la situación en la que se hace la grabación
      • el tema general de toda la grabación y el específico del fragmento transcrito
    • otras informaciones de carácter específico recogidas en listas cerradas
      • el nivel de dificultad del texto para su utilización en ELE
      • las observaciones lingüísticas para su utilización en ELE
      • las funciones comunicativas marcadas en la transcripción
      • las palabras claves para determinar los temas que utilizar en ELE.
C-Or-DiAL se estructura según dos tipologías de texto, si bien casi todos los textos se pueden considerar del registro informal y con alto grado de espontaneidad, se dividen en:
  • Espontáneos: diálogos y conversaciones
  • No espontáneos y públicos: entrevistas, clases, conferencias, conversaciones en el trabajo, conversaciones con fines predeterminados y charlas.



ISBN 978-88-6655-315-1
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License

Creato da admin
Ultima modifica 08 September 2015, 10:56
 
 


Sviluppato con Plone

Questo sito è conforme ai seguenti standard: