Análisis de errores de aprendientes de francés lengua extranjera (FLE) basado en corpus orales

  1. Valverde Mateos, Ana
Zuzendaria:
  1. Concha Sanz Miguel Zuzendaria
  2. Antonio Moreno Sandoval Zuzendaria

Defentsa unibertsitatea: Universidad Autónoma de Madrid

Fecha de defensa: 2012(e)ko ekaina-(a)k 04

Epaimahaia:
  1. Théophile Ambadiang Presidentea
  2. Paula Gozalo Gómez Idazkaria
  3. Aurora Martín de Santa Olalla Kidea
  4. Eduardo de Gregorio Godeo Kidea
  5. Nicolás Campos Plaza Kidea

Mota: Tesia

Laburpena

Hace quince o veinte años, la investigación sobre muestras colosales de datos legibles por los ordenadores, es decir los corpus, todavía estaba en manos de una avanzadilla muy minoritaria de estudiosos. En el momento actual, el aumento considerable del interés por la comprensión intelectual del lenguaje humano y por el desarrollo de lenguajes artificiales útiles para la ingeniería informática, la han convertido en un foco de atención muy importante para otras ciencias auxiliares que se benefician de sus progresos. El presente proyecto de investigación lleva por título: ¿Análisis de errores de aprendientes de Francés como Lengua Extranjera (FLE) basado en corpus orales¿, y propone la aplicación de los corpus orales al ámbito de la enseñanza de lenguas, como medio de diagnóstico y descripción de la interlengua (o competencia de comunicación transitoria) de los aprendientes hispanohablantes de francés. Su contenido se encuadra en la intersección de la Lingüística de Corpus, la metodología de enseñanza de las lenguas y la metodología tradicional para el análisis de datos. La técnica elegida es un sistema de análisis de errores basado en taxonomías existentes, utilizadas anteriormente para la confección de otros corpus orales de aprendientes de francés de ámbito europeo, como el corpus FRIDA (FRench Interlanguage DAtabase), creado por el proyecto europeo FreeText, cuyo propósito era desarrollar un sistema de diagnóstico automático de errores para aprendientes de FLE. Justificación del proyecto En su barómetro de febrero 20101, el Centro de Investigaciones Sociológicas (CIS) nos recordaba que la mayor parte de los españoles no conocía ningún idioma extranjero, y que más del 90% no estudiaba ninguno. Ese mismo año, la oficina estadística europea, Eurostat, confirmaba lo que era un secreto a voces: casi un 46,6% de los españoles entre 25 y 64 años no tenía noción alguna de ningún idioma extranjero, frente al 38,3% de la media de la Unión Europea2. No es lugar aquí para indagar las razones profundas de la mala salud del aprendizaje de las lenguas en España, pero sí para dejar constancia de nuestra sospecha de que algo tendrán que ver la frustración y desmotivación que a menudo dicen experimentar los estudiantes cuando constatan que los hablantes nativos parecen manejar una lengua distinta a la que ellos han aprendido en clase. Muchos de ellos se quejan asimismo de sus excesivas dificultades para expresarse oralmente, teniendo en cuenta la cantidad de energía y de tiempo que invierten en el aprendizaje del habla. El conjunto de estas reflexiones se encuentra en el origen de nuestro convencimiento de que una profundización en el conocimiento de la interlengua de los aprendientes hispanohablantes aprendientes de francés, mediante un análisis exhaustivo de los errores más frecuentes que cometen en las prácticas de interacción oral en contexto educativo, podrían contribuir a esclarecer algunas causas del tan comentado desfase entre esfuerzo desplegado y resultados obtenidos. Tal vez, y esa es nuestra hipótesis de trabajo, la información sobre los errores generalmente asociados a ciertos procedimientos psicolingüísticos subyacentes, nos ayude a tipificar las dificultades concretas de desarrollo de una comunicación oral efectiva para este público meta específico. Docentes y estudiantes están emplazados a alcanzar los objetivos de comunicación promulgados por el Marco Común Europeo de Referencia (MCER), eje común para el desarrollo de los currícula del aprendizaje de las lenguas a nivel europeo. Aspiramos a que nuestro estudio contribuya a una mejor fundamentación de los enfoques pedagógicos, que ayude a los profesores a planificar su trabajo de manera más efectiva, y a los aprendientes a mejorar su competencia oral de forma progresiva, adecuándola a los distintos contextos, situaciones comunicativas y tipos de hablantes nativos. Por otra parte, estamos también convencidos de que la observación de producciones orales auténticas sistematizadas y procedentes de entornos no nativos ofrecerá a los docentes (generalmente, también no nativos), una oportunidad de abordar la lengua de estudio de una manera diferente, más adaptada a las dificultades objetivas, y que presenta nuevas vías por explorar. Creemos firmemente que la didáctica de las lenguas no puede ser efectiva si no se apoya en la individualización y en la adaptación a las necesidades reales de comunicación de los alumnos. A estos últimos, trabajar con corpus les brindará la oportunidad de ensayar un nuevo paradigma de estudio. Un análisis exhaustivo de una variedad de lengua, sólo puede darse de manera productiva a partir de una cantidad suficiente de datos. Dichos datos deben poseer, además, unas características técnicas muy específicas, que les permite ser fácilmente almacenados, consultados y reutilizados, mediante las distintas herramientas informáticas hoy disponibles. Nada de esto es posible sin la existencia de un corpus, en este caso de un corpus oral de aprendientes. Pese a ello, estamos en condiciones de afirmar que no existen en la actualidad corpus orales de aprendientes hispanohablantes de FLE publicados o difundidos entre la comunidad científica. Los corpus que se conocen se reducen a corpus escritos muy específicos y a corpus basados en la interacción (asíncrona) a través del desarrollo de actividades de comunicación asistida por ordenador (CMC o Computer Mediated Communication). El corpus que hemos creado se denomina CORAF (Corpus ORal de Aprendientes de Francés), y está diseñado e implementado mediante la metodología desarrollada para la compilación de corpus orales por el Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid. CORAF podrá convertirse en la base para la implementación de futuros análisis de actuaciones o del discurso. En la presente tesis, daremos cuenta del desarrollo de la aplicación que suele ser prioritaria para este tipo de corpus: el análisis sistemático de errores. En este caso, caracterizaremos los errores desde tres puntos de vista: el lingüístico, el descriptivo y el etiológico, siendo este último el que más datos nos proporcione sobre los procesos que moviliza el aprendiente para la construcción de su interlengua.