Saltar la navegación

C. Acceso directo con habla

Antes de recomendar el acceso al ordenador con un sistema de reconocimiento de voz es recomendable valorar ciertos aspectos del habla del usuario, puesto que determinarán las características del sistema a utilizar o la imposibilidad de utilizarlo.

La valoración del habla puede hacerse opcionalmente para cualquier usuario, aunque maneje perfectamente el teclado y el ratón, puesto que el sistema de reconocimiento de voz proporciona uno de los accesos más rápidos a la escritura de textos. Sólo será obligatorio valorar el habla cuando el usuario no haya conseguido ningún acceso eficiente al teclado ni con mano, ni con cabeza, ni con pie.

Para realizar la valoración del habla no hace falta disponer de un sistema de reconocimiento de voz, pues se valoran parámetros que pueden apreciarse en una comunicación oral. Sin embargo, siempre que se detecte cualquier tipo de disartria en el habla posteriormente conviene confirmar la recomendación manejando directamente uno de estos sistemas. Como no todos los sistemas de reconocimiento de voz proporcionan las mismas prestaciones ni exigen las mismas capacidades de habla, se recomienda disponer de un sistema de habla continua con comandos para control del entorno. Con este sistema se podrá confirmar la capacidad de dictado continuo (dictando unas frases en el procesador de textos), el habla discreta, los comandos de larga extensión y los comandos simples (dictando comandos previamente preparados para estos fines).

Cuándo debe valorarse

Cuando no se ha logrado un acceso eficiente al teclado convencional se debe evaluar la capacidad de habla del usuario. Se considera que el acceso al teclado es eficiente cuando con las manos, la cabeza o los pies:

  • no hay cansancio precoz
  • se realiza con suficiente rapidez para las necesidades del usuario
  • no hay movimientos involuntarios al teclear
  • se recupera la posición de reposo

En cualquier otro caso también se puede completar opcionalmente este apartado. Por ejemplo, los usuario con problemas de aprendizaje pueden tener dificultades para una utilización perfecta del teclado mientras que un acceso con comandos verbales puede permitirles utilizar algunos programas educativos. En el caso de un usuario con ceguera puede interesarle utilizar uno de estos sistemas para el dictado de textos o para realizar acciones que normalmente se llevan a cabo con el ratón.

Una persona sin problemas en el habla podrá manejar perfectamente cualquiera de los sistemas de reconocimiento de voz, por lo que no habría que realizar ninguna valoración adicional. Pero si esta persona presenta cualquier problema en el habla entonces si es importante realizar la valoración, puesto que es muy probable que necesite una recomendación sobre el tipo de sistema más aconsejable, la configuración de alguno de sus parámetros o el entrenamiento del habla.

Qué se valora

En este apartado se valora:

Limitaciones en el habla

  • Capacidad de pronunciación.
  • Cambios en la pronunciación.
  • Sonidos comodín.

Cansancio al hablar

Cuando el usuario no puede pronunciar las palabras correctamente, de forma que resulta muy difícil diferenciar palabras distintas, podrá manejar el sistema de reconocimiento de voz en modo comando-control, es decir, no podrá dictar textos complejos pero si podrá dictar algunas pocas palabras y manejar las opciones de algunas aplicaciones. La amplitud de los comandos reconocidos dependerá de la capacidad que tenga el usuario para pronunciar palabras que se diferencien fonéticamente.

La utilización de un sistema de reconocimiento de voz para dictado de textos requiere un mayor control del habla. Además de la capacidad para pronunciar diferenciadamente un gran vocabulario, se exigirá que la pronunciación sea estable, es decir, que no haya cambios frecuentes en:

  • El volumen, el tono, el ritmo o la entonación. El sistema de reconocimiento de voz está constantemente adaptándose a la forma de hablar del usuario, pero si el usuario realiza cambios constantes en los parámetros básicos el sistema nunca terminará de adaptarse y, por tanto, no se asegura una buena tasa de reconocimiento, es decir, reconocerá siempre con errores.
  • La articulación de los fonemas y los sinfones (por ejemplo, "pla", "tra"). (La pronunciación no tiene que ser completamente correcta, pero en este caso se requerirá un gran periodo de entrenamiento con el sistema hasta que reconozca sin errores. Debe advertirse de esto al usuario, pues puede considerar no eficiente el sistema de reconocimiento de voz.)

Si además se desea manejar un sistema de habla continua el usuario tendrá que ser capaz de hablar sin realizar pausas entre palabras y mucho menos dentro de la propia palabra. Además, esto también afecta el reconocimiento de comandos largos.

Otro factor que afecta al reconocimiento es la emisión involuntaria de sonidos comodín ("eh"), risas u otros sonidos.

Por último, es importante determinar si el usuario se fatiga al hablar de forma continuada, al menos para asegurar una sesión de trabajo de diez minutos.