Proyectos


RECONOCIMIENTO DEL LOCUTOR POR COMPARACIÓN DE ESPECTROS Y ANÁLISIS CON COEFICIENTES DE ESCALA Y COEFICIENTES WAVELET

 

INVESTIGADOR(ES) PRINCIPAL(ES):

NOMBRE
DEDICACIÓN

Diana Marcela Orozco Villada

0 horas

Natalia Nieto Betancourt

0 horas

 

CODIGO CIE

E6-07-7

NOMBRE DEL GRUPO DE INVESTIGACIÓN
PROPONENTE

ELECTROFISIOLOGÍA

SI
NOMBRE
PARTICIPACION
DEDICACIÓN

Ricardo López Varona

Tutor

0 Horas

 

TIPO DE CONVOCATORIA

2007. Cuarta Convocatoria

TIPO DE PROYECTO

Investigación Aplicada

OBJETIVO(S)

GENERAL: Identificar y validar la identidad de una persona mediante la compara ción de los espectros y análisis con coeficientes de escala y coeficientes waveletes, de señales de voz de muestras adquiridas de un determinado número de personas. ESPECÍFICOS: - Explicar las nociones básicas del funcionamiento del aparato fonatorio humano y algunos conceptos sobre la estructura del lenguaje. - Realizar una revisión bibliográfica sobre los principales conceptos de la teoría Wavelet y del toolbox Wavelet de Matlab. - Comparar con base en investigación bibliográfica los modelos de producción de voz: del tracto vocal y de radiación con el modelo de predicción lineal (PLC), para realizar un acercamiento y explicación de las señales de voz. - Obtener archivos (o muestras) de voz un determinado número de personas por medio de un micrófono y visualizarlas a través del entorno gráfico de Matlab. - Identificar las características principales que influyen en la formación del espectro de una señal de voz, como son la tonalidad, intensidad y timbre. - Analizar los espectros de las señales adquiridas mediante el análisis Wavelet. - Verificar y validar la identidad del locutor en una muestra determinada. - Realizar una aplicación con el entorno gráfico de Matlab (GUI-Graphical User Interface) que permita visualizar los resultados obtenidos. - Calcular la eficiencia del método desarrollado. - Elaborar el documento final de tesis de grado.

RESUMEN

Este proyecto presenta una de las aplicaciones del procesamiento digital de señales: el reconocimiento del locutor. Para esto, se comienza con una explicación de los conceptos fundamentales acerca del sistema fonatorio humano y sobre la estructura sintáctica y semántica del lenguaje, también se realiza un acercamiento a las señales de voz, con una comparación entre los principales modelos de producción de la voz humana. Una vez explicados los factores que influyen en la forma de las señales, se empieza su tratamiento, que básicamente se realiza mediante El proyecto presenta una de las aplicaciones del procesamiento digital de señales: el reconocimiento de la identidad del locutor. Para lograrlo, se da una breve revisión literaria donde se explican los conceptos fundamentales acerca del sistema fonatorio humano y de la estructura sintáctica y semántica del lenguaje. Posteriormente se explica el modelo matemático de producción y emisión de voz a través del tracto vocal, donde se obtiene una función de transferencia que describe el comportamiento de los órganos que participan en la producción y emisión de sonidos. Para lograr el objetivo del proyecto, el método empleado se divide en dos fases, la fase de entrenamiento y la fase de reconocimiento. En la fase de entrenamiento inicialmente se adquieren las señales, en donde se minimizan los efectos del ruido y otras alteraciones, posteriormente son analizadas a través del análisis wavelet y los métodos de extracción de características, los cuáles permiten obtener las características determinantes del reconocimiento, como son el espectro, los formantes, que contienen un modelamiento del filtro de predicción lineal (LPC), y la envolvente que corresponde a la respuesta al impulso glotal del tracto vocal. Finalmente las anteriores características se clasifican de manera que se obtiene un patrón o generalización de ellas a través de métodos estadísticos. La fase de reconocimiento se divide en la identificación y en la verificación del individuo, en donde la identificación se hace a través de la mínima distancia euclidiaua entre la señal a reconocer y la señal patrón de la respuesta en frecuencia del tracto vocal, para luego ser verificada la identidad por comparación de espectros y comparación de la envolvente espectral. Finalmente se obtiene la identidad del individuo la cuál es presentada con un porcentaje de confiabilidad del método empleado, por medio de una interface gráfica de usuario (GUI). Conclusiones 1.Se desarrolla e implementa un método de identificación y verificación de la identidad del locutor, basado en la comparación de tres criterios establecidos, la correlación de espectros de la señal original con la señal reconstruida, obtenida por coeficientes de escala y coeficientes Wavelet; la comparación de distancias ecuclidianas entre formantes y la comparación de distancias euclidianas entre envolventes. 2.Fue posible identificar en las señales analizadas una de las principales características de la voz, como lo es la frecuencia fundamental, a través del análisis cepstral. Igualmente se estimaron las frecuencias de los formantes, a través de los coeficientes de predicción lineal (LPC). 3. En la fase de entrenamiento se aplica análisis Wavelet para obtener uno de los criterios para el reconocimiento, a partir de estas señales se aplicaron las técnicas de extracción de características. Se calcularon las raíces del polinomio de la función de transferencia que describe el tracto vocal, que corresponde a los formantes obtenidos por el análisis de predicción lineal, igualmente se calcularon los coeficientes cepstrales, donde, de las bajas frecuencias de estos se obtuvo la envolvente espectral; de las altas frecuencias se estimó la frecuencia fundamental, los cuales conforman otros dos criterios para la etapa de reconocimiento.

ESTADO

Concluido

FECHA DE INICIO

31/07/2007

FECHA DE FINALIZACION

30/04/2008

PRODUCTOS

NOMBRE
CATEGORÍA
ENLACE

El uso de la transformada Wavelet discreta en la reconstrucción de señakes sinusoidales

Revista especializada