Audio digital e compressão
Quando se fala em Televisão geralmente não nos lembramos do audio, porém , no audio se usa varias ferramentas que nos ajudarão a compreender melhor a compressão de video.
Do audio podemos falar que possui duas fontes:
1-Do microfone que capta o som do ar , ou
2-De um equipamento que gera formas de ondas , ( normalmente não natural ), complexas.
De qualquer maneira são sinais eletricos na faixa de 20 Hz á 20 KHz analógicos , que iremos converter em digital.
O primeiro passo , é escolher o numero de bits por amostra , e a frequencia de clock.
Para escolha do numero de bits por amostra teremos que decidir qual a faixa dinamica que queremos trabalhar, pois isto representa em digital um numero , cujo valor menor é zero e o maior, é o ponto de saturação.
Como norma pratica o ponto de saturação é +24 dBm ou 400mW o restante tira-se desta tabela:
Para facilitar , o padrão MPEG aceita qualquer audio até 24 bits, mas os fabricantes de circuitos integrados só tem processadores de 16 bits.
A escolha da frequencia de clock é baseada no teorema de Nyquist , ou seja, o dobro da maior frequencia do sinal (20 KHz), como padrão Fc=48KHz.
Então vamos analizar a lagura de faixa para 20 bits que é o normal em estudio.
Banda= 20 x 48 KHz =960 KHz por canal, para estereo 2 x 960 KHz = 1920 KHz ou 1,92 MHz .
Somando-se os bites de controle chegaremos á 3,072 MHz de banda para um sinal estereo.
Veja o protocolo AES/EBU:

Como se vê , o protocolo AES/EBU é composto de 32 bits dos quais estaremos usando apenas 20 bits para o audio o que aumenta o numero total de bits.
O preambulo é o grupo de 4 bits que identifica o canal de audio a que os bits pertence, direito ou esquerdo.
Bem , se formos transmitir este audio , junto com o video , num canal de 6MHz, estaremos ocupando metade do canal, só para o audio.
O quê fazer ???
Os estudiosos observaram que ,passando o sinal de audio num analizador de espectro , a maior parte do espectro de audio fica vazio, na maior parte do tempo e que a energia se concentra em pequenas faixa.
Outra observação importante é que o limiar de ruido, para o ouvido humano não é linear para todas as frequencias.

Veja o grafico, só precisamos transmitir o que estiver dentro da faixa verde, portanto podemos alterar a quantidade de bits por amostra conforme a frequencia do sinal.
Outro detalhe é que cada faixa é convertida para baixo e requantizado com um clock menor, resultando menos bits por faixa para a mesma qualidade (faixa de 740 Hz com clock de 1,5 KHz).
Destas observações foi tirado o algoritmo de compressão do nivel II do MPEG-2 que é conhecido por;
APCM (Adaptive Pulse Code Modulation ) pois ele realiza uma adaptação do sinal ás regras de comportamento do ouvido humano.

Veja no diagrama em blocos.
O sinal de audio, entra na forma descrita no protocolo AES/EBU e é dividido em 32 subfaixas ou sub-bandas que são tratadas por uma tabela "Psycoauditiva" e conformadas para a minima necessidade de bits por amostra, e então é requantizada, e agrupadas de tres em tres, para formar o "STREAM" de saida com os bites de controle, conforme o protocolo MPEG-1.

Obs: este trabalho todo é executado por "micro-processadores dedicados" e demanda um certo tempo que é chamado de "Delay A to A" ou seja atraso Analogico até Analogico.
Com este procedimento MPEG conceguiu o seguinte resultado:

Vale lembrar que o MPEG-2 manda junto uma amostra de tempo para manter o sincronismo do audio com o video,mas isto veremos mais adiante na parte de compressão de video.