martes, 27 de mayo de 2014

Las herramientas del proyecto COMUNICA

Los modelos para la terapia de los trastornos del habla son múltiples; lo cual se ha enfatizado con el uso de las tecnologías del habla. Aquí reseñamos las herramientas que ofrece el proyecto COMUNICA. El objetivo es encontrar mediante las tecnologías del habla métodos que permitan a los niños con trastornos del habla desenvolverse adecuadamente en la etapa de pre-lenguaje, el período crítico para la adquisición del lenguaje y el desarrollo general de este último. Estas tecnologías facilitarán una mejor comunicación del niño y, por lo tanto, una mejor interacción con su entorno.

PRE-LINGUA. Esta fase abarca la etapa del pre-lenguaje (primer año de vida) así como el período crítico del lenguaje (1-5 años); se busca estimular la capacidad de habla en el niño para así poder detectar problemas. Los aspectos que se consideran son la detección de la actividad de habla y el control de intensidad. Mediante el análisis de la señal sonora se controla una animación a manera de juego para que el niño se haga consiente de su habla.

Ventana principal de Pre-Lingua

A. Detección de la actividad de habla. Se utiliza un programa llamado Voice Activity Detector (VAD) que reconoce, procesa y segmenta automáticamente el habla. Lo que el niño observa es un fondo negro en el que aparecen líneas y triángulos que aparecen cuando se detecta la actividad de habla. Estas figuras se mueven en la ventana acorde a la señal sonora; con esto el niño nota que puede dibujar con el uso de su voz, así como distinguir el habla de los otro tipo de sonidos. VIDEO



B. Control de la intensidad. Se utiliza la animación de un auto que avanza cuando se detecta el habla. El incremento en la intensidad se refleja en una mayor velocidad en el auto.



Otra animación es la de un dragón que se eleva o desciende según la intensidad del habla.


C. Control de la respiración. La intensidad del soplo en los segmentos no sonoros se convierten en la rotación de los molinos.



D. Control del tono. El pitch o frecuencia fundamental determina la posición vertical del objeto; mientras que la intensidad, la velocidad del mismo.



E. Vocalización. Se muestran las cinco vocales del español acorde a sus formantes, cada una tiene una diana en la que se muestran con puntos las emisiones del niño. Cuando la pronunciación es correcta, los animales que acompañan a la vocal en cuestión se mueven para incentivar al niño.



2. VOCALIZA. se trata de una interfaz basada en tecnologías del habla que ayuda al usuario, de manera sencilla y atractiva, trabajar en tres niveles: fonológico, sintáctico y semántico. VIDEO



  1. Nivel fonológico. Pronunciación. El usuario debe enunciar la palabra que aparece en la pantalla, el programa evalúa su habla de acuerdo al progreso que ha tenido.
    Evocación. El usuario puede practicar cualquier palabra que desee.

  1. Nivel sintáctico. Oraciones. El usuario pronuncia en el orden correcto los elementos de una oración. De nuevo se evalúa lo que el niño produce para mostrar su avance.


  1. Nivel semántico. La aplicación está entrenada mediante adivinanzas que elige el terapeuta; se le hace una pregunta al usuario y se le presentan tres posibles respuestas. El usuario debe pronunciar correctamente la respuesta para poder avanzar a la siguiente adivinanza.

En todos los juegos se utiliza el reconocimiento de habla (ASR por sus siglas en inglés) para detectar si la emisión del niño fue la esperada. Por otro lado, se utiliza la síntesis de habla para mostrar la correcta pronunciación de una palabra dada. A continuación se muestran las funciones que tiene el programa Vocaliza:

  1. ASR. El modelo acústico se basa en 822 unidades dependientes de contexto, un modelo de silencio y otro “inter-word”; lo que da un total de 824 unidades. 
  2. Síntesis de habla. Vocaliza permite al terapeuta grabar palabras, adivinanzas u oraciones que el programa utilizará, en lugar de la síntesis, para mostrar al usuario la pronunciación correcta; lo cual permite al sistema adaptarse a la edad, patología y otros aspectos del usuario.
  3. Adaptación al habla del usuario. El programa permite utilizar un modelo acústico para el Reconocimiento de Habla dependiente o independiente del usuario; esto es importante para mostrar el progreso del niño; además de que hace más flexible la evaluación de la señal sonora. Para adaptar el modelo acústico al usuario se siguen los siguientes pasos:

    El usuario graba su emisión con la pantalla de entrenamiento



    Posteriormente, se revisa que la grabación tenga la calidad necesaria mediante la visualización de la señal sonora. Estos dos pasos pueden repetirse las veces que sean necesarias.



                El usuario elige una de las muestras para adaptar el modelo acústico.

Este software permite guardar las grabaciones de diferentes usuarios; cada uno tiene una carpeta para que el alumno pueda copiar su información y así poder trabajar desde otra computadora.

Esquema de Vocaliza

VOCALIZAL2 está enfocado a la enseñanza del español como lengua extranjera, tiene la misma interfaz. VIDEO 


VIVO. Es un software parecido a la parte de vocalización de Pre-Lingua, el usuario pronuncia las vocales, con lo que aparece la vocal con una imagen; en el lado derecho aparecen la intensidad, la frecuencia fundamental, los formantes y la onda sonora. Los círculos que aparecen en la pantalla indican que tan acertada fue la emisión.



CUÉNTAME. Este programa trabaja el nivel pragmático, utiliza tres juegos:

Ventana principal de Cuéntame
Respóndeme: El usuario selecciona un tema y se le hacen preguntas al respecto.



Descríbeme: Se presenta un estímulo visual para que el usuario describa un objeto.



Actúa: Se le pregunta al usuario cuáles son los pasos a seguir para realizar una acción dada.


Para responder a las pruebas, el niño debe pronunciar su respuesta para que el programa la evalúe, por lo que también se utiliza el Reconocimiento de Habla. VIDEO


 ReFoCas y ReFoGal. El Registro Fonológico del Castellano y el Registro Fonológico del Gallego son herramientas para evaluar, como su nombre indica, el nivel fonológico de estas dos lenguas. Primero se crea o se selecciona un usuario para guardar las grabaciones y así poder observar el progreso del alumno; luego, se presenta un estímulo visual de un objeto para que el usuario lo denomine; por último, el programa hace una evaluación, para la cual es posible observar la onda sonora.


Estos programas se utilizan en la Universidad de Zaragoza en España, aunque se pueden DESCARGAR GRATUITAMENTE. Por otro lado, están dirigidos a un público que no necesariamente esté familiarizado con el uso de una computadora, por eso su interfaz es sencilla y clara. Estas son las características principales de estos softwares:


Pre-Lingua
Vocaliza y Vocaliza L2
Cuéntame
ViVo
ReFoCas y ReFoGal
Niveles del lenguaje
Prelenguaje

Fonológico
Semántico
Sintáctico
Pragmático
Fonológico
Fonológico
Aspectos que trabaja
Discriminación del habla
Respiración
Intensidad
Tonalidad
Vocales
Articulación
Denominación
Secuenciación de los elementos de una oración
Descripción
Secuenciación de acciones
Vocales
Intensidad
Frecuencia fundamental
Articulación
Reconocimiento del Habla
Síntesis del Habla
Visualización de la onda sonora
No
No
Evaluación de la onda sonora
No
No
No
Grabación por usuario
No
No
Modelo acústico dependiente del usuario
No
No
No
No


REFERENCIAS

Proyecto COMUNICA

Rodríguez Dueñas, William Ricardo, Eduardo Lleida Solano Pre-Lingua: Una herramienta de apoyo para el pre-lenguaje

Rodríguez Dueñas, W.R., Lleida Solano, Eduardo; Vaquero, C, Sanz, O. Speech Technology Applied to Children with Speech Disorders

Vaquero, O., Saz, O., Lleida, E., Costa, A., Escaríz, A., Del Río, S., Sampedro, R., Gómez, B. ReFoCaS: Registro Fonológico Castellano. ReFoGaL: Rexistro Fonológico Galego

lunes, 26 de mayo de 2014

Visualizadores del aparato fonador


LOS SONIDOS DEL HABLA:  Este proyecto fue producido por el Centro Nacional de Información y Comunicación Educativa del Ministerio de Educación y Ciencia. La página muestra:

La distribución geográfica de las distintas lenguas que trabaja (español, gallego, catalán, y euskera o vasco)

Cómo se produce la fonación y los órganos involucrados en la misma

Diferencia entre vocales y consonantes



Las vocales de cada lengua en contexto para el cuadro y aisladas para la visualización del aparato fonador. Para escuchar la pronunciación, hay que dar click en alguna palabra del cuadro o en una imagen. 



Consonantes en contexto para el cuadro y aisladas para la visualización del aparato fonador. Para escuchar la pronunciación, hay que dar click en alguna palabra del cuadro o en una imagen. En la parte de abajo se muestra una descripción sencilla del fonema.




SOUNDS OF SPEECH. Universidad de Iowa. Está disponible para el inglés de Estados Unidos, alemán y distintas variantes del español, las cuales se especifican cuando es necesario. Para el caso del español, se hace una distinción entre consonantes y vocoides, estas últimas incluyen vocales, semiconsonantes, semivocales y diptongos. Después de seleccionar un determinado fono, se puede observar la articulación en su conjunto mediante una animación, o bien, lo que ocurre con cada parte del aparato fonador por separado. También se produce el fono en contexto (en diferentes palabras). 
En la parte superior derecha de la ventana hay tres vínculos: la página del Alfabeto Fonético Internacional, descripción anatómica del aparato fonador, y una encuesta para evaluar el visualizador.

Aquí un video que resultará más ilustrativo.

METAVOX V3. El objetivo es ayudar al usuario a tener una correcta pronunciación, ya sea para el sector clínico y terapéutico o el sector de lengua española (ver http://www.euphoniaediciones.com/pdf/cuadro_aplicaciones_metavox.pdf). 

El programa tiene una explicación teórica (se explica el modo y punto de articulación así como la vibración o no de las cuerdas vocales) acompañada de una sección de video.




SPEECH SOUNDS ON CUE. Se trata de un software para el inglés del Reino Unido que permite trabajar cada fonema por separado o en una palabra. Primero se presenta una instrucción para realizar cada fonema acompañada de un video.



Cada lección incluye una frase u oración que promueve la respuesta correcta; un estímulo visual del objeto y de la pronunciación. 



Asimismo, permite grabar la respuesta del usuario.



Aquí un video sobre cómo utilizar el software, así como otros programas para distintas necesidades.


ICATIANI. Se trata de un software desarrollado para el Centro de Atención Múltiple de la escuela pública Jean Piaget de Puebla dirigido, principalmente, a niños con hipoacusia (problemas de percepción auditiva) para mejorar su adquisición del lenguaje. El niño puede ver una animación llamada Baldi pronunciar una palabra (síntesis del habla), la cual el usuario tendrá que repetir para que el programa evalúe su enunciación (Reconocimiento de habla). 

Baldi


En resumen, tenemos lo siguiente:


Sonidos del habla
Sounds of speech (Iowa)
Metavox V3
Speech Sounds on Cue
Icatiani
Idioma (s)
Español de España, Catalán, Euzkera y Gallego
Inglés de EUA, Alemán, distintas variantes del Español
Español
Inglés de Reino Unido
Español de México
Descripción del fono
No
Descripción del aparato fonador
No
No
No
Fono aislado o en contexto
Ambos
Ambos
Ambos
Ambos
Ambos
Grabación y evaluación del usuario
No
No
No
Especializado en trastornos del habla
No
Animación o video
Animación
Ambos
Animación
Video
Animación
Gratuito
No
No
Página o software
Página
Página
Programa
Programa
Programa
Otros
Descripción de cómo se produce el habla