La popularidad de los sistemas de reconocimiento de voz

A pesar del éxito actual de los sistemas de reconocimiento de voz, su uso no está exento de problemas.

Un grupo de investigadores de la Universidad de Stanford, en Estados Unidos, identificó sesgos raciales en los sistemas de reconocimiento de voz de Apple, Google, Amazon, IBM y Microsoft.

Así lo indicó la agencia de noticias española Europa Press y añadió que, en el estudio, publicado en la revista Proceedings of the National Academy of Sciences, se entrevistó a 42 personas blancas y 73 negras mediante el empleo de sistemas de reconocimiento de voz para la transcripción.

A pesar de estos inconvenientes, el uso de estos sistemas sigue en auge y cada vez es más habitual en las empresas. Recientemente, el asistente de voz de Amazon añadió una nueva mejora en sus sistemas que permite reconocer al hablante y personalizar los contenidos, una ventaja con la que ya cuentan otros servicios de la competencia.

La opción de reconocimiento del hablante es conocida como voice recognition. Por otro lado, existe el reconocimiento del habla (speech recognition).

“El reconocimiento del habla implica grabar palabras habladas usando un micrófono o un teléfono. El audio se convierte en un conjunto de palabras almacenadas digitalmente en los dispositivos de reconocimiento de voz”, señala el medio online diario.es.

Según la Agencia Best, este 2020, más de la mitad de las búsquedas móviles en todo el mundo se realizarán por voz.

FUNIBER patrocina una gran variedad de programas universitarios centrados en capacitar a los profesionales en el área de las nuevas tecnologías, así como los distintos usos que pueden tener hoy en día. Uno de los cursos ofrecidos es la Maestría en Dirección Estratégica en Ingeniería de Software.

Fuentes: Un grupo de investigadores afirma que existe sesgo racial en los sistemas de reconocimiento de voz.

Alexa ya puede reconocer tu voz y diferenciarla de otros, así puedes activarlo en tu móvil.

Tecnologías de voz que llegan a Canarias: reconocimiento del habla, ‘speech to text’ y transcripciones.

El 50% de las búsquedas en 2020 serán por voz.

Foto: Todos los derechos reservados.