Inicio
Conceptos básicos
Breve historia
Procesamiento digital
Aplicaciones

Reconocimiento de voz. Cuantificación vectorial

Una parte importante en cualquier tipo de procesamiento de voz viene a ser la optimización de los algoritmos en cuanto a velocidad y almacenamiento. La técnica que a continuación se expone permitirá un ahorro en memoria lo que a su vez permitirá que los algoritmos se ejecuten a mayor velocidad ya que no tendrán que hacer uso de dispositivos externos de memoria.

Las técnicas de parametrización de la señal vocal se realizan tomando una secuencia de ventanas de tiempo, cada una de las cuales es representada por un número p de parámetros. Podemos apreciar que cada ventana de tiempo se puede representar por un vector de p dimensiones. Cuando se almacenan los parámetros lo que generalmente se realiza es cuantificar cada parámetro separadamente usando un número determinado de bits. Esto se conoce como cuantificación escalar y no es la forma mas económica de almacenamiento ya que implica la ocurrencia uniforme de las ventanas de la señal vocal en el espacio vectorial. En aplicaciones de codificación y reconocimiento resulta mas conveniente y económico el empleo de una técnica conocida como cuantificación vectorial.

La idea principal de la cuantificación vectorial es particionar el espacio vectorial en sectores, cada uno de los cuales será representado por un solo vector que puede ser el centroide. El conjunto de centroides viene a ser el libro índice (codebook) que conforman los niveles de cuantificación y a cada uno se le asigna una dirección o etiqueta. Como la parametrización se realiza por ventanas de tiempo pequeños representados por vectores de 14 dimensiones, a cada ventana se le asignará un vector. Para efectuar la cuantificación de un vector de entrada lo que se realiza es asignarle la dirección del vector del libro índice mas cercano evaluado mediante una medida de disimilitud que puede ser la distancia cepstral euclídea o cualquier otra como la distancia de Itakura.

Un aspecto muy importante de cualquier sistema de cuantificación vectorial es la obtención del libro índice (codebook), el espacio vectorial debe ser dividido en sectores los cuales se hallan partiendo de vectores de entrenamiento. Dichos vectores deben representar fielmente el espacio de interés. El libro índice se obtiene empleando un algoritmo conocido como LBG, cuyo nombre se deriva de los creadores Yoseph Linde, Andrés Buzo y Robert Gray.

El algoritmo LBG debe partir de un libro índice inicial Â0 con el cual se compara cada vector del espacio a cuantizar con cada componente del libro índice. Se compone una partición de distorsión mínima P(Âm) clasificando cada vector mediante la distancia mínima con los vectores del libro índice. La suma de las distancias se compara con el umbral de distorsión, si resulta mayor se vuelve a calcular una nueva partición hasta que la de distancia total sea inferior al umbral.

 01  02  03  04  05  06  07  08  09  10  11
El Portal del Webmaster
El Portal del Webmaster
El Portal del Webmaster

Página de teleco



 Downloads
 Links
 Conclusiones
 Experimentos
 Bibliografía
Resumen
Contacte con nosotros
Proyecto de la asignatura de Ingeniería de ondas I .