El reconocimiento de voz o reconocimiento del
habla es una rama de la inteligencia
artificial cuya finalidad es posibilitar la comunicación entre humanos
y sistemas informáticos. Un sistema de reconocimiento de voz tiene la capacidad
de detectar y entender las palabras que un ser humano emite de forma
natural. Existen sistemas de reconocimientos de voz más o menos sofisticados,
habiendo aquellos que entienden las palabras de manera fácil, y otros con más
dificultades para comprender el habla de los humanos. Los softwares de
reconocimiento de voz más comunes en el mercado actual son Siri de Apple,
Alexa de Amazon y Cortana de Microsoft. Los softwares de reconocimiento de voz
más comunes en el mercado actual son Siri de Apple, Alexa de Amazon y
Cortana de Microsoft.
El funcionamiento interno de un sistema de reconocimiento de
voz es complejo, pero de forma resumida, funciona así:
1. El sistema detecta las palabras que un humano emite.
2. Luego, convierte estas palabras en un formato que sea
legible por la máquina.
3. Finalmente, según el mensaje recibido, el sistema procede a reaccionar. Esta reacción puede ser la ejecución de una orden, ofrecer una respuesta, o seguir el flujo de una conversación.

No hay comentarios.:
Publicar un comentario