El objetivo de la compresión de las señales de voz es producir una representación compacta para su transmisión a través de un canal de comunicaciones, de tal forma que cuando la señal sea reconstruida en su recepción sea percibida como una señal muy parecida o indistinguible de la original. Los dos principales baremos para medir la calidad y el parecido a la señal original en recepción son la inteligibilidad y naturalidad de la señal de voz.
La referencia del estándar de calidad para estas señales es la calidad de una señal sobre línea telefónica convencional, por ejemplo muestreada a 8Khz, cuantificada con la ley a o µ y codificada con 8 bits; y cuya máxima componente espectral sea de 3.3Khz. Esto resulta en una tasa binaria de 64Kbps.
Esta tasa es demasiado elevada para los sistemas de comunicaciones en tiempo real, por lo que el objetivo de los códecs para voz es representar la señal con el menor número de bits posible, siempre que la señal reconstruida en el receptor sea aceptablemente parecida a la señal original.
El siguiente menú interactivo muestra una descripción de los principales códecs empleados para la codificación de voz humana:
G.721, G.723, G.726 y G.727 | GSM | G.723.1 | G.728 LD-CELP | G.729 | iLBC, iSaC, SVOPC | RT Audio | |||