Este proyecto presenta una de las aplicaciones del procesamiento digital de señales: el reconocimiento del locutor. Para esto, se comienza con una explicación de los conceptos fundamentales acerca del sistema fonatorio humano y sobre la estructura sintáctica y semántica del lenguaje, también se realiza un acercamiento a las señales de voz, con una comparación entre los principales modelos de producción de la voz humana. Una vez explicados los factores que influyen en la forma de las señales, se empieza su tratamiento, que básicamente se realiza mediante El proyecto presenta una de las aplicaciones del procesamiento digital de señales: el reconocimiento de la identidad del locutor. Para lograrlo, se da una breve revisión literaria donde se explican los conceptos fundamentales acerca del sistema fonatorio humano y de la estructura sintáctica y semántica del lenguaje. Posteriormente se explica el modelo matemático de producción y emisión de voz a través del tracto vocal, donde se obtiene una función de transferencia que describe el comportamiento de los órganos que participan en la producción y emisión de sonidos. Para lograr el objetivo del proyecto, el método empleado se divide en dos fases, la fase de entrenamiento y la fase de reconocimiento. En la fase de entrenamiento inicialmente se adquieren las señales, en donde se minimizan los efectos del ruido y otras alteraciones, posteriormente son analizadas a través del análisis wavelet y los métodos de extracción de características, los cuáles permiten obtener las características determinantes del reconocimiento, como son el espectro, los formantes, que contienen un modelamiento del filtro de predicción lineal (LPC), y la envolvente que corresponde a la respuesta al impulso glotal del tracto vocal. Finalmente las anteriores características se clasifican de manera que se obtiene un patrón o generalización de ellas a través de métodos estadísticos. La fase de reconocimiento se divide en la identificación y en la verificación del individuo, en donde la identificación se hace a través de la mínima distancia euclidiaua entre la señal a reconocer y la señal patrón de la respuesta en frecuencia del tracto vocal, para luego ser verificada la identidad por comparación de espectros y comparación de la envolvente espectral. Finalmente se obtiene la identidad del individuo la cuál es presentada con un porcentaje de confiabilidad del método empleado, por medio de una interface gráfica de usuario (GUI).
Conclusiones
1.Se desarrolla e implementa un método de identificación y verificación de la identidad del locutor, basado en la comparación de tres criterios establecidos, la correlación de espectros de la señal original con la señal reconstruida, obtenida por coeficientes de escala y coeficientes Wavelet; la comparación de distancias ecuclidianas entre formantes y la comparación de distancias euclidianas entre envolventes.
2.Fue posible identificar en las señales analizadas una de las principales características de la voz, como lo es la frecuencia fundamental, a través del análisis cepstral. Igualmente se estimaron las frecuencias de los formantes, a través de
los coeficientes de predicción lineal (LPC).
3. En la fase de entrenamiento se aplica análisis Wavelet para obtener uno de los criterios para el reconocimiento, a partir de estas señales se aplicaron las técnicas de extracción de características. Se calcularon las raíces del polinomio de la función de transferencia que describe el tracto vocal, que corresponde a los formantes obtenidos por el análisis de predicción lineal, igualmente se calcularon los coeficientes cepstrales, donde, de las bajas frecuencias de estos se obtuvo la envolvente espectral; de las altas frecuencias se estimó la frecuencia fundamental, los cuales conforman otros dos criterios para la etapa de reconocimiento.