6. Formato AU

En un formato de fichero muy asociado a máquinas Sun y Next. Su estructura es muy sencilla, las razones de compresión que puede llegar a ofrecer son pequeñas y destaca sobre todo su soporte de longitudes de muestras muy altas comparadas con otros formatos (32 y 64 bits). Se compone de tres secciones:

Cabecera AU

Se compone de seis campos de 32 bits con la siguiente estructura:
		struct {
			long magic;
			long offset;
			long size;
			long encoding;
			long samplerate;
			long channels;
		}AUheader;
magic Es el número 0x2E736E64, que representa en ASCII a la cadena ".snd". Este número permite identificar a un fichero como de formato AU.
offset Indica el punto de comienzo de la zona de datos, expresado en bytes. Su valor mínimo es 24, que corresponde a cuando no existen datos adicionales entre cabecera y datos.
size Expresa el tamaño de la región de datos, que si no se conoce debe ser el valor 0xFFFFFFFF.
encoding Especifica la codificación empleada para el almacenamiento de las muestras de sonido. Algunos de los posibles valores son:
1 – 8 bits Ley-mu RDSI
2 – 8 bits PCM lineal
3 – 16 bits PCM lineal
4 – 24 bits PCM lineal
5 – 32 bits PCM lineal
6 – 32 bits IEEE punto flotante
7 – 64 bits IEEE punto flotante
23 – 8 bits Ley-m comprimido según el estándar CCITT G.721 (ADPCM) para codificación de voz.

Los valores posibles son muchos, los 256 menores están reservados por Next. El resto está disponible para formatos específicos de la aplicación.
samplerate Tasa de muestreo en muestras por segundo (sps).
channels Número de canales. Los datos correspondientes a codificaciones multicanal se organizan en tramas de muestra [ver Campo de datos].

Campo de información

Tras la cabecera AU se puede colocar un campo de información de propósito y formato libre. La longitud de este campo está determinado por el campo offset de la cabecera. La cabecera tiene longitud fija, de 24 bytes, por lo que este campo tiene una longitud de offset – 24 bytes. Sus usos fundamentales son la inclusión de información de copyright en el fichero y la descripción del mismo utilizando caracteres ASCII imprimibles.

Campo de datos

El campo de datos comienza en la posición indicada por offset y puede tener longitud no definida. En configuraciones de formato multicanal las tramas se agrupan en tramas de muestra, tal que el campo de datos es una sucesión de tramas de muestra. Una trama de muestra contiene tantas muestras como número de canales, y cada una de las muestras corresponde a un canal diferente. Para la reproducción del fichero será necesario que se obtenga del mismo una tasa de samplerate tramas de muestra por segundo.