Las señales de voz son representaciones gráficas de las ondas sonoras producidas por el aparato fonador humano. Éstas han sido un gran aliciente en el reconocimiento de palabras de forma automática para la construcción de máquinas capaces de entender lo que está diciendo una persona e igualmente en hacer que éstas expresen oraciones de forma clara y concreta [1]. También las señales de voz se usan como un refuerzo dentro del diagnóstico sobre la condición fisiológica del tracto vocal de un paciente, proporcionando objetividad a la hora de emitir un juicio sobre la salud de la persona examinada [2]. Es fundamental resaltar que las señales de voz, así como gran parte de las señales fisiológicas, son dinámicas, algunas veces presentan comportamientos transitorios, y en general tienen propiedades no estacionarias (i.e. sus momentos estadísticos y su distribución de probabilidad son cambiantes en el transcurso del tiempo) [2,3]. Puesto que hay un gran interés en la extracción de características de las señales de voz para contribuir al desarrollo de sus aplicaciones, se han usado diversas técnicas de análisis para ayudar a cumplir con este propósito, e.g. la representación de la señal en términos de su frecuencia [1,4-6], los análisis tiempo-frecuencia [7-15] y una de las más utilizadas son los coeficientes MFCC (Mel-Frequency Cepstral Coefficients) [16-19]. Cada una de estas técnicas presenta validez, tanto matemática como físicamente, a señales con características específicas [20], e.g., en el análisis espectral se toma por sentado que las series temporales son lineales y estacionarias para toda la representación del acontecimiento a estudiar, si una señal no cumple con estas particularidades se mostrará un espectrograma con falsos componentes de frecuencia [21]. El método de los datos sustitutos [22] se presenta como una forma de investigar la no linealidad de cualquier serie temporal para tener pruebas sobre qué técnica es la más adecuada en la extracción de características; el procedimiento de aplicación del método consiste básicamente en generar un conjunto de datos sustitutos derivados de la serie temporal original que satisfagan cierta hipótesis y que además compartan ciertas propiedades lineales con ella, calcular una estadística adecuada tanto para los datos originales como para los sustitutos y finalmente hacer una comparación que permita determinar si la hipótesis original no se ajusta a ninguna de las hipótesis planteadas, es necesario destacar que no se busca aceptar las hipótesis sino encontrar motivos suficiente para rechazarla. Varios autores [23-27] han aplicado el método en señales de voz usando los algoritmos planteados en [22] y algunas modificaciones [28-31]; sin embargo éstas técnicas se basan en la presunción de estacionariedad para pequeños segmentos de la señal [23,32], suposición que en el caso de las señales de voz a sido erróneamente aceptada, lo cual ha llevado a la obtención de resultados dudosos. Es por este motivo, que en la presente investigación se pretende aplicar una modificación al método de los datos sustitutos recientemente desarrollada por Nakamura et al. [33-35], la cual hace el método viable para responder la pregunta sobre el determinismo y la linealidad o no linealidad de una serie temporal no estacionaria, tal como la señal de voz.