Compressão de video



Como se viu em "TBC" e "TV digital", a quantidade de bits necessários para descrever ,em digital, uma imagem é muito grande para ser transmitido ou gravado para arquivo ,pois demanda uma banda muito grande. Então temos que descartar tudo o que for desnecessario e possivel de descartar. Após muitos estudos, chegou-se a conclusão que em uma imagem , quando dividida em blocos, os valores se repetem em mais de 50 %. Desta observação, varias ferramantas de compressão foram criadas mas dentre elas apenas algumas foram implementada no sistema JPEG que foi o inicio de tudo. Um dos fatores que mais contribuiu para o sucesso do JPEG foi que toda e qualquer sujestão deveria ser testada e avaliada com todo o criterio antes de ser aceita. As ferramentas de compressão que demonstraram facilidade de implementação foram: Compressão Psicovisual ,Adaptive predictive encoding e Entropy encoding (Huffman code). A compressão Psicovisual tal qual a compressão Psicoauditiva , baseia-se no estudo do comportamento humano quanto a percepsão dos sentidos e no caso da visão diz: Estudos comprovam que o sistema visual humano é insensível a variações de imagem na ordem de 5% quando o fundo for de um tom continuo, tremendamente sensível a pequenos erros no nivel DC e baixas frequencias da imagem, e muito menos sensível quanto mais altas forem as frequencias do video. Outro fato bastante conhecido, é a sensibilidade do olho ao ruido, que diminue com o aumento da frequencia tanto que para medir o ruido do video se usa um filtro de ponderação chamado "weighting network". Para utilizar estes conhecimentos teremos que transformar as informações de video "tensão versus tempo" em informações de frequencias , o que nos conduz à TRANSFORMADA DE FOURIER. Lembre-se das faixas e subfaixas do audio? Por isto foi definido "O coração do JPEG" tem que ser DCT (Discret Cosine Transform). Então voltamos ao nosso TBC:



Substituimos os circuitos de saida por um Transformador de Fourier e uma nova memoria cujos dados agora são em vez de video digital , coeficientes de frequencias , ou os cossenos das varias frequencias do video. Até agora não comprimimos nada, a quantidade de bits é a mesma.



Desta memoria vamos transferir os coeficientes para um quantizador que vai analizar o sinal, de acordo com as leis "psicovisuais", se o valor for menor que 5% descarta e põe "zerro", se for de alta frequencia requantiza com numero de bits menor, de acordo com uma tabela "psicovisual"



Com este sistema chegamos à redução de 50% à 60% no numero de bits o que é muito pouco.
Neste ponto, analizando a ferramenta de compressão proposto por MARKOV, e fazendo uma adaptação criou-se o Gerador de Predição adaptiva, com uma pequena alteração no DCT. Se dividirmos a imagem em blocos de pixels de 8 x 8 ou 64 pixels, e compararmos bloco por bloco de toda a imagem ( estamos trabalhando com fotos ou imagem parada "Frizada") e encontrarmos os blocos semelhantes , mandamos o receptor repetir este bloco e transmitimos apenas a diferença ou o erro cometido pela previsão. Logicamente o primeiro bloco tem que ser transmitido por inteiro , porém a partir do segundo bloco, a probabilidade de se encontrar blocos quase iguais a um já transmitido é na ordem de 75% com diferencial na ordem de 15% a 20%. Esta previsão de semelhanças é que se chama de ADAPTIVA.



No quadro acima está a descrição do processo DCT+Adaptive Predictor.
Este sinal é enviado ao circuito de "Entropy Encoding" ou Huffman code , que será estudado na proxima pagina .


Para quem se interessa por uma explicação mais acurada do processo DCT sugerimos o livro de PETER D. SYMES "Vide compression" Mc Graw Hill.
E-mail