Primeiro, vamos relembrar os dois princípios fundamentais quando se fala em taxa de amostragem:
1) Se a gente admite que a maior frequência que vai ser amostrada é F, a taxa de amostragem precisa ser no mínimo, 2F. Então, admitindo que vamos registrar frequências até 20.000 Hz, a taxa de amostragem não pode ser menor que 40.000 Hz.
2) Não podemos deixar entrar no conversor nenhuma frequência acima de F, porque se não, vamos alterar o conteúdo abaixo de F. Ou seja, precisamos usar um filtro muito íngreme na entrada do conversor, que não deixe nenhuma frequência acima de F entrar.
Então o pessoal no início do áudio digital, admitiu que não somos capazes de ouvir nada acima de 20.000Hz. Então era razoável que se usasse uma taxa de pelo menos 40.000 Hz.
Ok, mas pelo item (2), não podemos deixar nada acima de 20.000 Hz entrar no conversor, e precisamos de um filtro muito sofisticado para realizar isso. Assim, decidiram deixar uma folga, usando uma taxa acima de 40.000 Hz (mas perto dela, porque a tecnologia ainda estava começando).
Bom, nessa época ainda se gravava em fita, e se a gente usasse 44.000Hz com 16 bits, qual seria a resposta em frequência de um gravador para que ele fosse capaz de armazenar o áudio digital (estéreo)? Simples: 44.000 x 16 x 2 = 1.411.200 Hz. Ou seja, o gravador teria que ter uma resposta em frequência de 1,4 MHz. Não rolava (a não ser nas máquinas de fita digitais, mas isso é outro assunto).
Parênteses: Os gravadores de videocassete conseguiam registrar sinais dessa ordem de grandeza, mas era vídeo e não áudio.
Daí a Sony criou os aparelhos PCM-1630, que pegavam o áudio digital e os transformava para que pudessem ser um “falso-vídeo”, podendo ser registrados em fitas de videocassete (os CD-Rs ainda estavam longe de serem criados).
Havia então a necessidade de se adequar o formato de áudio para que um número inteiro de samples coubesse em uma linha de vídeo. Um fator complicador é que havia dois padrões diferentes de TV: o NTSC nos EUA e o PAL na Europa. O NTSC usava 60 fields por segundo (porque a frequência da rede elétrica é 60Hz) e o PAL usava 50 fields por segundo – rede de 50Hz na Europa e Japão. Era conveniente achar uma taxa de amostragem que além de tudo funcionasse nos dois sistemas.
Beleza. Se a gente colocar 3 samples por linha de vídeo, e se usarmos como linhas ativas 245 no NTSC, que roda em 60Hz teremos 245 x 60 x 3 = 44.100Hz. No PAL, usando 294 linhas em 50Hz, temos 294 x 50 x 3 = 44.100Hz.
Conclusão: curiosamente, o valor padrão do CD de áudio (44.100Hz) vem de uma exigência do vídeo.
Mas e 48kHz, também vem daí? Não mesmo. Mas isso é outro assunto pra outro post.
Gosta dos textos do Fábio Henriques? Então você também vai gostar dos livros:
– Guia de microfonação
– Guia de Mixagem Volume 1 – Volume 2 – Volume 3
Saiba mais sobre o autor: www.fabiohenriques.com.br
Confira o curso Compressores Sem Segredos por Fábio Henriques
Acredito que você vá gostar também desse post: Cursos de Produção Musical gratuitos
Gostei.. esperando a continuação kk
Fábio Henriques sempre didático, indo direto ao ponto de forma fácil e tranquila de entender! Sensacional!