Mudanças nas unidades de medidasafetam o coeficentes por quê

CAMPO TÉCNICO

[1] A presente invenção refere-se à codificação de sinais deáudio e, particularmente, aos métodos de reconstrução de alta frequência incluindo um transpositor de harmônicos de domínio de frequência.

ANTECEDENTES DA INVENÇÃO

[2] Tecnologias HFR, tal como a tecnologia Replicação deBanda Espectral (SBR), permite aperfeiçoar significativamente a eficiência de decodificação de codecs de áudio perceptuais, tradicionais. E combinação com Advanced Audio Coding (AAC) MPEG- 4, as tecnologias HFR formam codecs de áudio muito eficientes, os quais já estão em uso dentro do sistema XM Satellite Radio e Digital Radio Mondiale, e também padronizados dentro de 3GPP, DVD Forum e outros. A combinação de AAC e SBR é chamada de aacPlus. Ela é parte do padrão MPEG-4 onde é referida como High Efficiency AAC Profile (HE-AAC). Em geral, a tecnologia HFR pode ser combinada com qualquer codec de áudio perceptual de uma forma compatível para frente e para trás, desse modo oferecendo a possibilidade de atualizar os sistemas de transmissão já estabelecidos como o MPEG Layer-2, usado no sistema Eureka DAB. Métodos de transposição HFR também podem ser combinados com codecs de fala para permitir fala de banda larga em taxas de bit ultrabaixas.

[3] A ideia básica por trás de HRF é a observação de quenormalmente está presente uma forte correlação entre as características da faixa de alta frequência de um sinal e as características da faixa de baixa frequência do mesmo sinal. Assim, uma boa aproximação para uma representação da faixa de alta frequência de entrada original de um sinal pode ser obtida por uma transposição de sinal a partir da faixa de baixa frequência para a faixa de alta frequência.

[4] Esse conceito de transposição foi estabelecido em WO98/57436 que é incorporado mediante referência, como um método para criar uma faixa de alta frequência a partir de uma faixa de baixa frequência de um sinal de áudio. Uma substancial economia em taxa de bits pode ser obtida mediante uso desse conceito em codificação de áudio e/ou codificação de fala. No que se segue, será feita referência à codificação de áudio, mas deve-se observar que os métodos e sistemas descritos são igualmente aplicáveis à codificação de fala e na codificação unificada de fala e áudio (USAC).

[5] Em um sistema de codificação de áudio baseado em HFR,um sinal de largura de banda inferior é apresentado a um codificador de forma de onda de núcleo para codificação, e frequências superiores são regeneradas pelo lado do decodificador utilizando transposição do sinal de largura de banda inferior e informação secundária adicional, a qual é tipicamente codificada em taxas de bits muito baixas e a qual descreve o formato espectral alvo. Para taxas de bits inferiores, onde a largura de banda do sinal codificado de núcleo é estreita, torna-se cada vez mais importante reproduzir ou sintetizar uma banda alta, isto é, a faixa de alta frequência do sinal de áudio, com características agradáveis de forma perceptual.

[6] Um dos problemas adjacentes que existem com os métodosde HFR harmônicos são as limitações opostas de uma resolução de alta frequência pretendida para obter a transposição de alta qualidade para os sons estacionários, e a resposta de tempo do sistema para os sons transientes ou de percussão. Em outras palavras, embora o uso de uma resolução de alta frequência seja vantajoso para a transposição de sinais estacionários, tal resolução de alta frequência tipicamente requer tamanhos grandes de janela que são prejudiciais ao se lidar com porções transientes de um sinal. Uma abordagem para lidar com esse problema pode ser a de mudar de forma adaptativa as janelas do transpositor, por exemplo, mediante uso de comutação de janela, como uma função das características de sinal de entrada. Tipicamente, janelas longas serão usadas para porções estacionárias de um sinal, para obter resolução de alta frequência, enquanto que janelas curtas serão usadas para porções transientes do sinal, para implementar uma boa resposta transiente, isto é, uma boa resolução temporal, do transpositor. Contudo, essa abordagem tem a desvantagem de que medidas de análise de sinal tal como detecção de transientes ou semelhantes têm que ser incorporadas no sistema de transposição. Tais medidas de análise de sinal envolvem normalmente uma etapa de decisão, por exemplo, uma decisão sobre a presença de um transiente, que aciona uma comutação do processamento de sinal. Adicionalmente, tais medidas afetam tipicamente a confiabilidade do sistema e podem introduzir artefatos de sinal ao se comutar o processamento de sinal, por exemplo, ao comutar entre tamanhos de janela.

[7] Para alcançar qualidade de áudio aperfeiçoada e parasintetizar a largura de banda exigida do sinal de banda alta, métodos HFR harmônicos empregam tipicamente várias ordens de transposição. Para implementar uma pluralidade de transposições de ordem de transposição diferente, as soluções da técnica anterior requerem uma pluralidade de grupos de filtros quer seja no estágio de análise ou no estágio de síntese ou em ambos os estágios. Tipicamente, um banco de filtros diferente é exigido para cada ordem de transposição diferente. Além disso, em situações onde o codificador de forma de onda de núcleo opera em uma taxa de amostra inferior à taxa de amostragem do sinal de saída final, há tipicamente uma necessidade adicional de converter o sinal de núcleo para a taxa de amostragem do sinal de saída, e essa sobreamostragem do sinal de núcleo normalmente é obtida mediante adição de ainda outro banco de filtros. No total, a complexidade computacional aumenta significativamente com um número crescente de diferentes ordens de transposição.

[8] O presente documento trata dos problemas anteriormentemencionados com relação ao desempenho de transiente de transposição de harmônicos e com relação à complexidade computacional. Como resultado, transposição de harmônicos aperfeiçoada é obtida com baixa complexidade adicional.

SUMÁRIO DA INVENÇÃO

[9] De acordo com um aspecto, é descrito um sistemaconfigurado para gerar um componente de alta frequência de um sinal a partir de um componente de baixa frequência do sinal. O sistema pode compreender um banco de filtros de análise compreendendo uma unidade de transformação de análise que tem uma resolução de frequência de Δf. A unidade de transformação de análise pode ser configurada para realizar, por exemplo, uma Transformada de Fourier, uma Transformada Rápida de Fourier, uma Transformada Discreta de Fourier ou uma Transformada de Ondaleta. O banco de filtros de análise pode compreender ainda uma janela de análise que tem uma duração de D . A janela de análise pode ter o formato, por exemplo, de uma janela Gaussiana, uma janela de Cosseno; uma janela de Hamming; uma janela de Hann; uma janela retangular; uma janela de Bartlett; ou uma janela de Blackman. O banco de filtros de análise pode ser configurado para fornecer um conjunto de sinais de sub-banda de análise a partir do componente de baixa frequência do sinal.

[10] O sistema pode compreender uma unidade de processamento não linear configurada para determinar um conjunto de sinais de subbandas de síntese com base em uma porção do conjunto de sinais de subbanda de análise, em que a porção do conjunto de sinais de sub-banda de análise é deslocada em fase por uma ordem de transposição T . Particularmente, os sinais de sub-banda podem compreender valores complexos e o deslocamento de fase pode compreender a multiplicação da fase dos valores de sub-banda complexos pela ordem T .

[11] O sistema pode compreender um banco de filtros de síntesecompreendendo uma unidade de transformação de síntese tendo uma resolução de frequência de QΔf. A unidade de transformação de síntese pode ser configurada para realizar a transformada inversa correspondente à transformada realizada pela unidade de transformação de análise. Além disso, o banco de filtros de síntese pode compreender uma janela de síntese tendo uma duração de D e tendo qualquer um dos formatos relacionados acima. Q é um fator de resolução frequência com Q > 1 e menor do que a ordem de transposição T. Em uma modalidade específica, o fator de resolução de frequência é selecionado como Q > 1. O banco de filtros de síntese pode ser configurado para gerar um componente de alta frequência do sinal a partir do conjunto de sinais de sub-banda de síntese.

[12] Tipicamente, o valor do produto da resolução de frequência δfe a duração D do banco de filtros de análise são selecionados com base no fator de resolução de frequência Q . Particularmente, o produto δfDApode ser proporcional a Em uma modalidade, o valor do produto deΔfDA é menor ou igual a 2 . Adicionalmente, o produto δfDA pode serQ +1maior do que . O valor do produto ΔfDA do banco de filtros de análisepode ser igual ao valor do produto QδfD do banco de filtros de síntese. Mediante seleção do banco de filtros de análise e/ou síntese de acordo com qualquer uma das regras acima, artefatos causados pela transposição de harmônicos nos transientes do sinal podem ser reduzidos ou completamente removidos, enquanto permitindo uma complexidade computacional reduzida do transpositor de harmônicos.

[13] O sistema pode compreender ainda uma segunda unidadede processamento não linear configurada para determinar um segundo conjunto de sinais de sub-banda de síntese a partir do conjunto de sinais de sub-banda de análise utilizando uma segunda ordem de transposição T ; em que o segundo conjunto de sinais de sub-banda de síntese é determinado com base em uma porção do conjunto de sinais de subbanda de análise e em que a porção do conjunto de sinais de sub-banda de análise é deslocada em fase pela segunda ordem de transposição T . A ordem de transposição Te a segunda ordem de transposição T podem ser diferentes. O sistema pode compreender ainda uma unidade de combinação configurada para combinar o conjunto de sinais de subbanda de síntese e o segundo conjunto de sinais de sub-banda de síntese; desse modo produzindo um conjunto combinado de sinais de sub-banda de síntese como uma entrada para o banco de filtros de síntese. A unidade de combinação pode ser configurada para adicionar ou calcular a média de sinais de sub-banda correspondentes a partir do conjunto de sinais de sub-banda de síntese e o segundo conjunto de sinais de sub-banda de síntese. Em outras palavras, a unidade de combinação pode ser configurada para sobrepor sinais de sub-banda de síntese do conjunto de sinais de sub-banda de síntese e o segundo conjunto de sinais de sub-banda de síntese correspondendo às faixas de frequência de sobreposição.

[14] Em uma modalidade, o banco de filtros de análise pode terum númeroK^de sub-bandas de análise, com K > 1, onde k é um índice de sub-banda de análise com k = 0,..., K -1. O banco de filtros de síntese pode ter um número NS de sub-bandas de síntese, com NS >0, onde n é um índice de sub-banda de síntese com n = 0,...,NS -1. Em tais casos, a unidade de processamento não linear pode ser configurada para determinar o enésimo sinal de sub-banda de síntese do conjunto de sinais de sub-banda de síntese a partir de um k-ésimo sinal de subbanda de análise e um (k+1)-ésimo sinal de sub-banda de análise do conjunto de sinais de sub-banda de análise. Particularmente, a unidade de processamento não linear pode ser configurada para determinar uma fase do enésimo sinal de sub-banda de síntese como a soma de uma fase deslocada do k-ésimo sinal de sub-banda de análise e uma fase deslocada do (k+1)-ésimo sinal de sub-banda de análise. Além disso, a unidade de processamento não linear pode ser configurada para determinar uma magnitude do enésimo sinal de sub-banda de síntese como o produto de uma magnitude exponenciada do k-ésimo sinal de sub-banda de análise e uma magnitude exponenciada do (k+1)-ésimo de sinal de sub-banda de análise.

[15] O índice de sub-banda de análise k do sinal de sub-bandade análise contribuindo para a sub-banda de síntese com índice de subbanda de síntese n pode ser dado pelo número inteiro obtido mediante truncamento da expressão Qn; em que um resto r pode ser dado por Qn -k. Em tais casos, a unidade de processamento não linear pode ser configurada para determinar a fase do enésimo sinal de sub-banda de síntese como a soma da fase do k-ésimo sinal de sub-banda de análise multiplicado por T(1-r) e a fase do (k+1)-ésimo sinal de sub-banda de análise multiplicado por T(r) , isto é, mediante realização de uma interpolação linear de fase. Adicionalmente, a unidade de processamento não linear pode ser configurada para determinar a magnitude do enésimo sinal de sub-banda de síntese como o produto da magnitude do k-ésimo sinal de sub-banda de análise elevado à potência de (1 -r) e a magnitude do (k +1)-ésimo sinal de sub-banda de análise elevado à potência de r , isto é, mediante determinação da média geométrica das magnitudes.

[16] O banco de filtros de análise e o banco de filtros de síntesepodem ser empilhados igualmente de tal modo que uma frequência central de uma sub-faixa de análise é dada por kΔf e uma frequênciacentral de uma sub-faixa de síntese é dada por nQΔf. Em uma modalidade alternativa, o banco de filtros de análise e o banco de filtros de síntese podem ser empilhados em número ímpar de tal modo que a frequência central de uma sub-banda de análise é dada por (k + 1)Δf e uma frequência central de uma sub-banda de síntese é dada por (n + 1) Q Δf; e a diferença entre a ordem de transposição T e o fator deresolução Qé par.

[17] Uma taxa de amostragem do componente de baixafrequência pode ser f . A unidade de transformação de análise pode realizar uma transformação de M pontos discretos. A janela de análise pode ter um comprimento de L amostras e/ou a janela de análise pode ser deslocada mediante um tamanho de salto de análise de Δs amostras ao longo do componente de baixa frequência. Em tais casos, a resolução de frequência pode ser dada por y Δf = fA-, a duração dajanela de análise pode ser dada porDA = LA- e/ou um passo de tempo fAfísico do banco de filtros de análise pode ser dada por

Mudanças nas unidades de medidasafetam o coeficentes por quê

[18] Uma taxa de amostragem do componente de alta frequênciapode ser f = Qf . A unidade de transformação de síntese pode realizar uma transformação de M pontos discretos, particularmente pode realizar a transformação inversa respectiva da unidade de transformação de análise. A janela de síntese pode ter um comprimento de L amostras e/ou a janela de síntese pode ser deslocada por um tamanho de salto de síntese de ΔS5 amostras do longo do componente de alta frequência. Em tais casos, a resolução de alta frequência pode ser dada p0r QΔf = A, a duração pode ser dada porD=± e/°u um passo de tempo físico do banco de filtros de síntese pode ser dado por AsS AsA

Mudanças nas unidades de medidasafetam o coeficentes por quê

[19] De acordo com um aspecto adicional, é descrito um sistemapara gerar um sinal de saída compreendendo um componente de alta frequência a partir de um sinal de entrada compreendendo um componente de baixa frequência utilizando uma ordem de transposição T . O sistema pode compreender uma unidade de janela de análise configurada para aplicar uma janela de análise de um comprimento de LA amostras, desse modo extraindo um quadro do sinal de entrada. O sistema pode compreender uma unidade de transformação de análise de ordem M e tendo uma resolução de frequência Af configurada para transformar as LA amostras em M coeficientes complexos. O sistema pode compreender uma unidade de processamento não linear, configurada para alterar a fase dos coeficientes complexos mediante uso da ordem de transposição T . A alteração da fase pode compreender mudar a fase dos coeficientes complexos conforme delineado no presente documento. O sistema pode compreender uma unidade de transformação de síntese de ordem M e tendo uma resolução de frequência QAf , configurada para transformar os coeficientes alterados em M amostras alteradas; em que Q é um fator de resolução de frequência menor do que a ordem de transposição T . Adicionalmente, o sistema pode compreender uma unidade de janela de síntese configurada para aplicar uma janela de síntese de um comprimento de Ls amostras às M amostras alteradas, gerando assim um quadro do sinal de saída.

[20] M pode se basear no fator de resolução de frequência Q .Particularmente, a diferença entre M e o comprimento médio da janela de análise e da janela de síntese (612) pode ser proporcional a (Q-1). Em uma modalidade, M é maior ou igual a (QLA+Ls)/2. Adicionalmente, M pode ser menor do que (TLA+Ls)/2.

[21] De acordo com outro aspecto, é revelado um método paragerar um componente de alta frequência de um sinal a partir de um componente de baixa frequência do sinal. O método pode compreender a etapa de fornecer um conjunto de sinais de sub-banda de análise a partir do componente de baixa frequência do sinal utilizando um banco de filtros de análise compreendendo uma unidade de transformação de análise tendo uma resolução de frequência de Δf e uma janela de análise tendo uma duração de D . Adicionalmente, o método pode compreender a etapa de determinar um conjunto de sinais de sub-banda de síntese com base em uma porção do conjunto de sinais de subbanda de análise, em que a porção do conjunto de sinais de sub-banda de análise é deslocada em fase por uma ordem de transposição T . Eventualmente, o método pode compreender a etapa de gerar o componente de alta frequência do sinal a partir do conjunto de sinais de sub-banda de síntese utilizando um banco de filtros de síntese compreendendo uma unidade de transformação de síntese tendo uma resolução de frequência de QΔf e uma janela de síntese tendo uma duração de D . Q é um fator de resolução com Q > 1 e menor do que a ordem de transposição T . O valor do produto da resolução de frequência Δf e a duração D do grupo de filtro de análise podem ser selecionados com base no fator de resolução Q .

[22] De acordo com um aspecto adicional, é descrito um métodopara gerar um sinal de saída compreendendo um componente de alta frequência a partir de um sinal de entrada compreendendo um componente de baixa frequência utilizando uma ordem de transposição T . O método pode compreender as etapas de aplicar uma janela de análise de um comprimento de LA amostras, extraindo assim um quadro do sinal de entrada; e de transformar o quadro de LA amostras do sinal de entrada em M coeficientes complexos utilizando uma transformação de análise de ordem M e resolução de frequência Δf. Adicionalmente, o método pode compreender a etapa de alterar a fase dos coeficientes complexos mediante uso da ordem de transposição T . A alteração da fase pode ser realizada de acordo com os métodos delineados no presente documento. Além disso, o método pode compreender as etapas de transformar os coeficientes alterados em M amostras alteradas utilizando uma transformação de síntese de ordem M e de resolução de frequência Qδf , em que Q é um fator de resolução de frequência menor do que a ordem de transposição T ; e aplicar uma janela de síntese de um comprimento de Ls amostras às M amostras alteradas, gerando assim um quadro do sinal de saída. M pode se basear no fator de resolução de frequência Q .

[23] De acordo com outro aspecto, é descrito um método paraprojetar um transpositor de harmônicos configurado para gerar um componente de alta frequência de um sinal a partir de um componente de baixa frequência do sinal. O método pode compreender a etapa de fornecer um banco de filtros de análise compreendendo uma unidade de transformação de análise que tem uma resolução de frequência de δf ; e uma janela de análise tendo uma duração de D ; o banco de filtros de análise sendo configurado para fornecer um conjunto de sinais de sub-banda de análise a partir do componente de baixa frequência do sinal. Além disso, o método pode compreender a etapa de fornecer uma unidade de processamento não linear configurada para determinar um conjunto de sinais de sub-banda de síntese com base em uma porção do conjunto de sinais de sub-banda de análise, em que a porção do conjunto de sinais de sub-banda de análise é deslocada em fase por uma ordem de transposição T . Além disso, o método pode compreender a etapa de fornecer um banco de filtros de síntese compreendendo uma unidade de transformação de síntese que tem uma resolução de frequência de Q Δf; e uma janela de síntese tendo uma duração de D ; o banco de filtros de síntese sendo configurado para gerar o componente de alta frequência do sinal a partir do conjunto de sinais de sub-banda de síntese; em que Q é um fator de resolução de frequência com Q > 1 e menor do que a ordem de transposição T. Além disso, o método pode compreender a etapa de selecionar o valor do produto da resolução de frequência δf e a duração D do banco de filtros de análise com base no fator de resolução de frequência Q .

[24] De acordo com outro aspecto, é descrito um método paraprojetar um transpositor configurado para gerar um sinal de saída compreendendo um componente de alta frequência a partir de um sinal de entrada compreendendo um componente de baixa frequência utilizando uma ordem de transposição T. O método pode compreender as etapas de fornecer uma unidade de janela de análise configurada para aplicar uma janela de análise de um comprimento de LA amostras, desse modo extraindo um quadro do sinal de entrada; e proporcionando uma unidade de transformação de análise de ordem M e tendo uma resolução de frequência δf configurada para transformar as LA amostras em M coeficientes complexos. Além disso, o método pode compreender a etapa de fornecer uma unidade de processamento não linear, configurada para alterar a fase dos coeficientes complexos mediante uso da ordem de transposição T . Além disso, o método pode compreender as etapas de fornecer uma unidade de transformação de síntese de ordem M e tendo uma resolução de frequência Qδf , configurada para transformar os coeficientes alterados em M amostras alteradas; em que Q é um fator de resolução de frequência menor do que a ordem de transposição T ; e de fornecer uma unidade de janela de síntese configurada para aplicar uma janela de síntese de um comprimento de Ls amostras as M amostras alteradas, gerando assim um quadro do sinal de saída. Eventualmente, o método pode compreender a etapa de selecionar M com base no fator de resolução de frequência Q .

[25] Deve-se observar que os métodos e sistemas incluindo suasmodalidades preferidas conforme delineados no presente pedido de patente podem ser usados individualmente ou em combinação com outros métodos e sistemas revelados nesse documento. Além disso, todos os aspectos dos métodos e sistemas delineados no presente pedido de patente podem ser combinados arbitrariamente. Particularmente, as características das concretizações podem ser combinadas entre si de uma forma arbitrária.

BREVE DESCRIÇÃO DOS DESENHOS

[26] A presente invenção será descrita agora por intermédio deexemplos ilustrativos, não limitando o escopo ou essência da invenção, com referência aos desenhos anexos, nos quais:

[27] a figura 1 ilustra a operação de um transpositor deharmônicos de domínio de frequência (FD) de ordem única exemplar;

[28] a figura 2 ilustra a operação de um transpositor deharmônicos exemplar utilizando várias ordens;

[29] a figura 3 ilustra a operação da técnica anterior de umtranspositor de harmônicos exemplar utilizando várias ordens de transposição, enquanto utilizando um banco de filtros de análise comum;

[30] a figura 4 ilustra a operação da técnica anterior de umtranspositor de harmônicos exemplar utilizando várias ordens de transposição, enquanto utilizando um banco de filtros de síntese comum;

[31] a figura 5 ilustra a operação de um transpositor deharmônicos exemplar utilizando várias ordens de transposição, enquanto utilizando um banco de filtros de síntese comum e um banco de filtros de síntese comum;

[32] a figura 5b ilustra um exemplo para o mapeamento de sinaisde sub-banda para um esquema de transpositor múltiplo de acordo com a figura 5;

[33] a figura 6a ilustra um transpositor múltiplo exemplar deordem T=2, 3, 4 utilizando um banco de filtros de análise comum e grupos de filtros de síntese separados;

[34] a figura 6b ilustra um transpositor múltiplo exemplar deordem T=2, 3, 4 utilizando um banco de filtros de análise comum e um banco de filtros de síntese comum;

[35] a figura 7 ilustra um exemplo para o mapeamento de sinaisde sub-banda para um transpositor múltiplo de acordo com a figura 6b;

[36] a figura 8 ilustra um Dirac em uma posição específicaconforme aparece nas janelas de análise e de síntese de um transpositor de harmônicos;

[37] a figura 9 ilustra um Dirac em uma posição diferente conformeaparece nas janelas de análise e síntese de um transpositor de harmônicos; e

[38] a figura 10 ilustra um Dirac para a posição da figura 9conforme aparece ao utilizar sobreamostragem de domínio de frequência.

DESCRIÇÃO DAS MODALIDADES PREFERIDAS

[39] As modalidades descritas abaixo são apenas ilustrativaspara os princípios da presente invenção para sobreamostragem em um banco de filtros de transpositor combinados. Entende-se que modificações e variações dos arranjos e dos detalhes aqui descritos serão evidentes para aqueles versados na técnica. Portanto, a intenção é a de ser limitado apenas pelo escopo das concretizações e não pelos detalhes específicos apresentados por intermédio de descrição e explanação dessas modalidades.

[40] A figura 1 ilustra a operação de um transpositor de harmônicosde domínio de frequência (FD) 100. Em uma forma básica um transpositor de harmônicos de T-ésima ordem é uma unidade que muda todos os componentes de sinal H(f) do sinal de entrada, isto é, uma sub-banda do sinal no domínio de frequência, para H(Tf). Isto é, o componente de frequência H(f) do sinal de entrada é deslocado para uma frequência T vezes superior. Para implementar tal transposição no domínio de frequência, um banco de filtros de análise 101 transforma o sinal de entrada a partir do domínio de tempo para o domínio de frequência e produz subfaixas complexas ou sinais de subfaixas, também referidos como subfaixas de análise ou sinais de subfaixa de análise. O banco de filtros de análise compreende tipicamente uma transformada de análise, por exemplo, uma transformada FFT, DFT ou de ondaleta, e uma janela de análise deslizante. Os sinais de sub-banda de análise são submetidos ao processamento não linear 102 modificando a fase e/ou a amplitude de acordo com a ordem de transposição escolhida T. Tipicamente, as saídas de processamento não linear produzem um número de sinais de subbandas que é igual ao número de sinais de sub-banda de entrada, isto é, igual ao número de sinais de sub-banda de análise. As sub-bandas modificadas ou os sinais de sub-banda, os quais também são referidos como sinais de sub-banda de síntese ou sub-bandas de síntese, são alimentados a um banco de filtros de síntese 103 o qual transforma os sinais de sub-banda a partir do domínio de frequência para o domínio de tempo e emite o sinal de domínio de tempo transposto. O banco de filtros de síntese 103 compreende tipicamente uma transformada inversa, por exemplo, uma FFT, inversa, uma DFT inversa ou transformada de ondaleta inversa, em combinação com uma janela deslizante de síntese.

[41] Tipicamente, cada banco de filtros tem uma resolução defrequência física Δf medida em Hertz e um parâmetro de passo de tempo físico Δt medido em segundos, em que a resolução de frequência física δf é normalmente associada à resolução de frequência da função de transformada e o parâmetro de passo de tempo físico Δt é normalmente associado ao intervalo de tempo entre funções de janela seguintes. Esses dois parâmetros, isto é a resolução de frequência e o passo de tempo, definem os parâmetros de tempo descontínuo, do banco de filtros; dada a taxa de amostragem escolhida. Mediante escolha dos parâmetros de passo de tempo físico, isto é, o parâmetro de passo de tempo medido em unidades de tempo, por exemplo, segundos, dos grupos de filtros de análise e de síntese de modo a serem idênticos, um sinal de saída do transpositor 100 pode ser obtido o qual tem a mesma taxa de amostragem que o sinal de entrada. Além disso, mediante omissão de processamento não linear 102 uma limitação perfeita do sinal de entrada na saída pode ser obtida. Isso requer um projeto cuidadoso dos grupos de filtro de análise e de síntese. Por outro lado, se a taxa de amostragem de saída for escolhida de modo a ser diferente da taxa de amostragem de entrada, uma conversão de taxa de amostragem pode ser obtida. Esse modo de operação também pode ser necessário no caso onde a largura de banda desejada do sinal de saída y é maior do que metade da taxa de amostragem do sinal de entrada x , isto é, quando a largura de banda de saída desejada exceder a frequência Nyqvist do sinal de entrada.

[42] A figura 2 ilustra a operação de um transpositor múltiplo ou desistema de transpositor múltiplo 200 compreendendo vários transpositores de harmônicos 201-1, ... , 201-P de diferentes ordens. O sinal de entrada que deve ser transposto é passado para um grupo de P transpositores individuais 201-1, 201-2, ... , 201-P. Os transpositores individuais 201-1, 201-2, ... , 201-P realizam uma transposição de harmônicos do sinal de entrada como delineado no contexto da figura 1. Tipicamente, cada um dos transpositores individuais 201-1, 201-2, ... , 201-P realiza umatransposição de harmônicos de uma ordem de transposição diferente T. Como exemplo, o transpositor 201-1 pode realizar uma transposição de ordem T=1, o transpositor 201-2 pode realizar uma transposição de ordem T=2, ... , e o transpositor 201-P pode realizar uma transposição de ordem T=P. Contudo, em termos genéricos, qualquer um dos transpositores 2011,... , 201-P pode realizar uma transposição de harmônicos de uma ordem de transposição arbitrária T. As contribuições, isto é, os sinais de saída dos transpositores individuais 201-1, 201-2, . , 201-P podem ser somados nocombinador 202 para produzir a saída combinada de transpositor.

[43] Deve-se observar que cada transpositor 201-1, 201-2, . ,201-P requer um banco de filtros de análise e um banco de filtros de síntese conforme ilustrado na figura 1. Além disso, a implementação usual dos transpositores individuais 201-1, 201-2, . , 201-P mudarátipicamente a taxa de amostragem do sinal de entrada processado mediante diferentes valores. Como exemplo, a taxa de amostragem do sinal de saída do transpositor 201-P pode ser T vezes superior à taxa de amostragem do sinal de entrada para o transpositor 201-P, em que T é a ordem de transposição aplicada pelo transpositor 201-P. Isso pode ser devido a um fator de expansão de largura de banda de T usado dentro do transpositor 201-P, isto é, devido ao uso de um banco de filtros de síntese que tem T vezes mais subcanais do que o banco de filtros de análise. Fazendo-se isto a taxa de amostragem e a frequência Nyqvist são aumentadas por um fator T. Como consequência, os sinais de domínio de tempo individuais podem precisar ser outra vez amostrados para possibilitar uma combinação dos diferentes sinais de saída no combinador 202. A reamostragem dos sinais de domínio de tempo pode ser realizada no lado de entrada ou no lado de saída de cada transpositor individual 201-1, 201-2, . , 201-P.

[44] A figura 3 ilustra uma configuração exemplar de umtranspositor múltiplo de harmônicos ou sistema de transpositor múltiplo 300 realizando várias ordens de transposição e utilizando um banco de filtros de análise comum 301. O ponto inicial para o projeto do transpositor múltiplo 300 pode ser o de projetar os transpositores individuais 201-1, 201-2, .., 201-P da figura 2 de tal modo que os grupos de filtros de análise (sinal de referência 101 in figura 1) de todos os transpositores 201-1, 2012, .., 201-P sejam idênticos e possam ser substituídos por um banco de filtros de análise único 301. Como uma consequência, o sinal de entrada de domínio de tempo é transformado em um único conjunto de sinais de sub-banda de domínio de frequência, isto é, um único conjunto de sinais de sub-banda de análise. Esses sinais de sub-banda são submetidos a diferentes unidades de processamento não linear 302-1,302-2, ... , 302-P para diferentes ordens de transposição. Conforme delineado acima no contexto da figura 1 cada unidade de processamento não linear realiza uma modificação da fase e/ou amplitude dos sinais de sub-banda e essa modificação difere para diferentes ordens de transposição. Subsequentemente, os sinais de sub-banda diferentemente modificados ou subbandas diferentemente modificadas têm que ser submetidos a diferentes grupos de filtros de síntese 303-1, 303-2, ., 303-P correspondendo às diferentes unidades de processamento não linear 302-1, 302-2, . , 302P. Como um resultado, P sinais de saída de domínio de tempo diferentemente transpostos são obtidos os quais são somados no combinador 304 para produzir a saída combinada de transpositor.

[45] Deve-se observar que se os grupos de filtros de síntese 3031, 303-2, ., 303-P correspondendo às diferentes ordens detransposição operam em diferentes taxas de amostragem, por exemplo, mediante uso de diferentes graus de expansão de largura de banda, os sinais de saída de domínio de tempo dos diferentes grupos de filtros de síntese 303-1, 303-2, . , 303-P precisam ser outra vez amostrados de forma diferente para alinhar os P sinais de saída a uma grade de tempo comum, antes de sua soma no combinador 304.

[46] A figura 4 ilustra uma operação exemplar de um transpositormúltiplo de harmônicos 400 utilizando várias ordens de transposição, enquanto utilizando um banco de filtros de síntese comum 404. O ponto inicial para o projeto de tal transpositor múltiplo 400 pode ser o projeto dos transpositores individuais 201-1, 201-2, .., 201-P da figura 2 de tal modo que os grupos de filtros de síntese de todos os transpositores sejam idênticos e possam ser substituídos por um banco de filtros de síntese único 404. Deve-se observar que de uma maneira análoga como na situação mostrada na figura 3, as unidades de processamento não lineares 402-1, 402-2, ... , 402-P são diferentes para cada ordem de transposição. Adicionalmente, os grupos de filtros de análise 401-1, 401-2, . , 401-P são diferentes para as diferentes ordens detransposição. Como tal, um conjunto de P grupos de filtros de análise 401-1, 401-2, . , 401-P determina P conjuntos de sinais de sub-banda de análise. Esses P conjuntos de sinais de sub-banda de análise são submetidos às unidades de processamento não linear, correspondentes 402-1, 402-2, . , 402-P para produzir P conjuntos de sinais de subbanda modificados. Esses P conjuntos de sinais de sub-banda podem ser combinados no domínio de frequência no combinador 403 para produzir um conjunto combinado de sinais de sub-banda como uma entrada para o banco de filtros de síntese único 404. Essa combinação no combinador 403 pode compreender a alimentação de sinais de subbanda diferentemente processados em diferentes faixas de sub-banda e/ou a sobreposição de contribuições de sinais de sub-banda para faixas de sub-banda sobrepostas. Em outras palavras, sinais de sub-banda de análise, diferentes os quais foram processados com diferentes ordens de transposição podem cobrir faixas de frequência de sobreposição. Como exemplo, um transpositor de segunda ordem pode transpor a sub-faixa de análise [2A,2B] para faixa de sub-banda [4A,4B]. Ao mesmo tempo, um transpositor de quarta ordem pode transpor a sub-banda de análise [A,B] para a mesma faixa de sub-banda [4A,4B]. Em tais casos, as condições de sobreposição podem ser combinadas, por exemplo, adicionadas e/ou ter a média calculada, por intermédio do combinador 403. O sinal de saída de domínio de tempo do transpositor múltiplo 400 é obtido a partir do banco de filtros de síntese comum 404. De uma maneira similar como delineado acima, se os grupos de filtros de análise 401-1, 401-2, ..., 401-P operam em diferentes taxas de amostragem, os sinais de domínio de tempo introduzidos nos grupos de filtros de análise diferentes 401-1, 401-2, . , 401-P podem precisar seroutra vez amostrados para alinhar os sinais de saída das diferentes unidades de processamento não linear 402-1, 402-2, . , 402-P para amesma grade de tempo.

[47] A figura 5 ilustra uma operação de um transpositor múltiplo deharmônicos 500 utilizando várias ordens de transposição e compreendendo um único banco de filtros de análise comum 501 e um único banco de filtros de síntese comum 504. Nesse caso, os transpositores individuais 201-1, 201-2, .., 201-P da figura 2 devem ser projetados de tal modo que ambos, os grupos de filtro de análise e os grupos de filtro de síntese de todos os P transpositores de harmônicos sejam idênticos. Se a condição dos grupos de filtros de análise e de síntese, idênticos para os diferentes P transpositores de harmônicos for satisfeita, então os grupos de filtro idênticos podem ser substituídos por um único banco de filtros de análise 501 e um único banco de filtros de síntese 504. As unidades de processamento não linear avançadas 502-1, 502-2, ., 502-P produzem diferentes contribuições para faixas de frequência parcialmente sobrepostos que são combinadas no combinador 503 para produzir uma entrada combinada para as sub-bandas respectivas do banco de filtros de síntese 504. Similarmente aos múltiplos transpositores de harmônicos 400 ilustrados na figura 4, a combinação no combinador 503 pode compreender a alimentação dos diferentes sinais de saída da pluralidade de unidades de processamento não linear 502-1, 502-2, ..., 502-P em diferentes faixas de sub-banda, e a sobreposição de múltiplas saídas de contribuição para faixas de sub-banda de sobreposição.

[48] Como já indicado acima, o processamento não linear 102tipicamente provê um número de sub-bandas em sua saída que corresponde ao número de sub-bandas na entrada. O processamento não linear 102 tipicamente modifica a fase e/ou a amplitude da sub-banda ou do sinal de sub-banda de acordo com a ordem de transposição subjacente T. Como exemplo, uma sub-banda na entrada é convertida em uma sub-banda na saída com frequência T vezes superior, isto é, uma sub-banda na entrada para o processamento não linear 102, isto é, a sub-banda de análise,

Mudanças nas unidades de medidasafetam o coeficentes por quê

pode ser transposta para uma sub-banda na saída do processamento não linear 102, isto é, a subbanda de síntese,

Mudanças nas unidades de medidasafetam o coeficentes por quê

, em que k é um número de índice de sub-banda e Δf se a resolução de frequência do banco de filtros de análise. Para permitir o uso de grupos de filtros de análise comum 501 e grupos de filtros de síntese comum 504, uma ou mais das unidades de processamento avançadas 502-1, 502-2, . , 502-P podeser configurada para fornecer um número de sub-bandas de saída que podem ser diferentes do número de sub-bandas de entrada.

[49] No que se segue, os princípios do processamento não linearavançado nas unidades de processamento não linear 502-1, 502-2, . ,502-P serão delineados. Com essa finalidade, supõe-se que

[50] o banco de filtros de análise e o banco de filtros de síntesecompartilham o mesmo parâmetro de passo de tempo físico Δt .

[51] o banco de filtros de análise tem uma resolução defrequência física Δf.

[52] o banco de filtros de síntese tem uma resolução defrequência física QΔf onde o fator de resolução Q > 1 é um número inteiro.

[53] Além disso, supõe-se que os grupos de filtro são igualmenteempilhados, isto é, a sub-banda com índice zero é centrada em torno da frequência zero, de tal modo que as frequências de centro de banco de filtros de análise são dadas por kδf onde o índice de sub-banda de análise k = 1,..., K -1 e K^ é o número de sub-bandas do banco de filtros de análise. As frequências de centro de banco de filtros de síntese são dadas por kQΔf onde o índice de sub-banda de síntese n = 1,..., NS -1 e N é o número de sub-bandas do banco de filtros de síntese.

[54] Ao efetuar uma transposição convencional de ordem denúmero inteiro T >1 como mostrado na figura 1, o fator de resolução Q é selecionado como Q = T e a sub-banda de análise processada de forma não linear k é mapeada para a sub-banda de síntese com o mesmo índice n=k. O processamento não linear 102 compreende tipicamente a multiplicação da fase da sub-banda ou do sinal de subbanda pelo fator T . Isto é, para cada amostra das sub-bandas de banco de filtros se podem escrever

Mudanças nas unidades de medidasafetam o coeficentes por quê

[55] onde θ(k) é a fase de uma amostra (complexa) da subbanda de análise k e θ (k) é a fase de uma amostra (complexa) da subbanda de síntese k. A magnitude ou amplitude de uma amostra da subbanda pode ser mantida não modificada ou pode ser aumentada ou diminuída por um fator de ganho constante. Devido ao fato de que T é um número inteiro, a operação da equação (1) é independente da definição do ângulo de fase.

[56] Em transpositores múltiplos convencionais, o fator deresolução Q de um banco de filtros de análise/síntese é selecionado para ser igual à ordem de transposição T do transpositor respectivo, isto é, Q = T. Nesse caso, a resolução de frequência do banco de filtros de síntese é TΔf e, portanto, depende da ordem de transposição T. Consequentemente é necessário utilizar diferentes grupos de filtros para diferentes ordens de transposição T quer seja no estágio de análise ou de síntese. Isso se deve ao fato de que a ordem de transposição T define o coeficiente de resoluções de frequência física, isto é o quociente da resolução de frequência δf do banco de filtros de análise e a resolução de frequência Tδf do banco de filtros de síntese.

[57] Para que se possa utilizar um banco de filtros de análisecomum 501 e um banco de filtros de síntese comum 504 para uma pluralidade de diferentes ordens de transposição T, propõe-se estabelecer a resolução de frequência do banco de filtros de síntese 504 para Qδf , isto é, propõe-se fazer a resolução de frequência do banco de filtros de síntese 504 independente da ordem de transposição T. Então surge a questão de como implementar uma transposição de ordem T quando o fator de resolução Q, isto é, o quociente Q da resolução de frequência física do banco de filtros de análise e síntese, não necessariamente obedece à relação Q = T .

[58] Conforme delineado acima, um princípio de transposição deharmônicos é que a entrada para a sub-banda de banco de filtros de síntese n com frequência central nQδf é determinada a partir de uma sub-banda de análise em uma frequência central T vezes inferior, isto é, na frequência central nQδf / T . As frequências centrais das subbandas de análise são identificadas através do índice de sub-banda de análise k como kδf . Ambas as expressões para a frequência central do índice de sub-banda de análise, isto é, nQδf / T e kδf , podem ser estabelecidas iguais. Considerando-se que o índice n é um valor de número inteiro, a expressão nQ é um número racional que pode ser expresso como a soma de um índice de sub-banda de análise denúmero inteiro k e um resto

Mudanças nas unidades de medidasafetam o coeficentes por quê

de tal modo que

Mudanças nas unidades de medidasafetam o coeficentes por quê

[59] Como tal, pode-se estipular que a entrada para uma subbanda de síntese com índice de sub-banda de síntese n pode ser derivada, utilizando uma transposição de ordem T, a partir da sub-banda de análise com o índice k dado pela equação (2). Em virtude do fato de que nQ é um número racional, o resto r pode ser igual a 0 e o valor k+r pode ser maior do que o índice de sub-banda de análise k e menor do que o índice de sub-banda de análise k+1, isto é, k <k + r <k +1. Consequentemente, a entrada para uma sub-banda de síntese com índice de sub-banda de síntese n deve ser derivada, utilizando uma transposição de ordem T, a partir das sub-bandas de análise com o índice de sub-banda de análise k e k+1, em que k é dado pela equação (2). Em outras palavras, a entrada de uma sub-banda de síntese pode ser derivada a partir de duas sub-bandas de análise consecutivas.

[60] Como um resultado do acima, o processamento não linearavançado realizado em uma unidade de processamento não linear 5021,502-2, ... , 502-P pode compreender a etapa de considerar duas subbandas de análise vizinhas com índice k e k +1 para fornecer a saída para sub-banda de síntese n . Para uma ordem de transposição T, a modificação de fase realizada pela unidade de processamento não linear 502-1, 502-2, . , 502-P pode, por exemplo, ser definida pelaregra de interpolação linear,

Mudanças nas unidades de medidasafetam o coeficentes por quê

[61] onde θA(k) é a fase de uma amostra da sub-banda de análisek, θA (k +1) é a fase de uma amostra da sub-banda de análise k+1, e θ (n) é a fase de uma amostra da sub-banda de síntese n. Se o resto r for próximo de zero, isto é, se o valor k+r for próximo de k, então a contribuição principal da fase da amostra de sub-banda de síntese é derivada da fase da amostra de sub-banda de análise da sub-banda k .Por outro lado, se o resto r for próximo de um, isto é, se o valor de k+r for próximo de k+1, então a contribuição principal da fase da amostra de sub-banda de síntese é derivada da fase da amostra de sub-banda de análise da sub-banda k+1. Deve-se observar que os multiplicadores de fase T(1 -r) e Trsão ambos números inteiros de tal modo que as modificações de fase na equação (3) são bem definidas e independentes da definição do ângulo de fase.

[62] Com relação às magnitudes das amostras de sub-banda, oseguinte valor médio geométrico pode ser selecionado para a determinação da magnitude das amostras de sub-banda de síntese,

Mudanças nas unidades de medidasafetam o coeficentes por quê

[63] onde a (n) denota a magnitude de uma amostra da sub- banda de síntese n , a (k) denota a magnitude de uma amostra da subbanda de análise k e aA (k +1) denota a magnitude de uma amostra da sub-banda de análise k+1. Deve-se observar que outras regras de interpolação para a fase e/ou a magnitude podem ser consideradas.

[64] Para o caso de um banco de filtros empilhados em númeroímpar, onde as frequências centrais do banco de filtros de análise são dadas por

Mudanças nas unidades de medidasafetam o coeficentes por quê

e as frequências centrais de banco de filtros de síntese são dadas por

Mudanças nas unidades de medidasafetam o coeficentes por quê

uma equação correspondente à equação (2) pode ser derivada mediante equiparação da frequência central de banco de filtros de síntese transposta

Mudanças nas unidades de medidasafetam o coeficentes por quê

e a frequência central de banco de filtros de análise

Mudanças nas unidades de medidasafetam o coeficentes por quê

Supondo um índice de número inteiro k e um resto

Mudanças nas unidades de medidasafetam o coeficentes por quê

[65] Aqueles versados na técnica considerarão que se T - Q, istoé, a diferença entre a ordem de transposição e o fator de resolução, for par, T(1 -r) e Trsão ambos, números inteiros e as regras das equações (3) e (4) podem ser usadas.

[66] O mapeamento das sub-bandas e análise em sub-bandas desíntese é ilustrado na figura 5b. A figura 5b mostra quatro diagramas para diferentes ordens de transposição T=1 a T=4. Cada diagrama ilustra como as faixas de origem 510, isto é, as sub-bandas de análise, são mapeadas em faixas alvo 530, isto é, sub-bandas de síntese. Para facilidade de ilustração, supõe-se que o fator de resolução Q seja igual a um. Em outras palavras, a figura 5b ilustra o mapeamento dos sinais de sub-banda de análise para sinais de sub-banda de síntese utilizando Eq.(2) e (3). No exemplo ilustrado o banco de filtros de análise/síntese é empilhado em número par, com Q = 1 e a ordem de transposição máxima T = 4.

[67] No caso ilustrado, a equação (2) pode ser escrita comon = k + r. Consequentemente, para uma ordem de transposição T=1, uma sub-banda de análise com um índice k é mapeada para uma subbanda de síntese correspondente n e o resto r é sempre zero. Isso pode ser visto na figura 5b onde, por exemplo, a faixa de origem 511 é mapeada de um a um para uma faixa alvo 531.

[68] No caso da ordem de transposição T=2, o resto r consideraos valores 0 e 54 e uma faixa de origem é mapeada para uma pluralidade de faixas alvo. Ao inverter a perspectiva, pode ser declarado que cada faixa alvo 532, 535 recebe uma contribuição a partir de até duas faixas de origem. Isso pode ser visto na figura 5b, onde a faixa alvo 535 recebe uma contribuição a partir das faixas de origem 512 e 515. Contudo, a faixa alvo 532 recebe uma contribuição a partir apenas da faixa de origem 512. Se for suposto que a faixa alvo 532 tem um índice par n, por exemplo, n=10, então a equação (2) especifica que a faixa alvo 532 recebe uma contribuição a partir da faixa de origem 512 com um índice k=n/2, por exemplo, k=5. O resto r é zero, não há contribuição a partir da faixa de origem 515 com índice k+1, por exemplo, k+1=6. Isso muda para a faixa alvo 535 com um índice ímpar n, por exemplo, n=11. Nesse caso, a equação (2) especifica que a faixa alvo 535 recebe contribuições a partir da faixa de origem 512 (índice k=5) e a faixa de origem 515 (índice k+1=6). Isso se aplica de uma maneira similar às ordens de transposição superiores T, por exemplo, T=3 e T=4, conforme mostrado na figura 5b.

[69] Uma interpretação adicional do processamento não linearavançado mencionado acima pode ser como a seguir. O processamento não linear avançado pode ser entendido como uma combinação de uma transposição de uma determinada ordem T em sinais de sub-banda intermediários em uma grade de frequência intermediária TΔf, e um mapeamento subsequente dos sinais de sub-banda intermediários para uma grade de frequência definida por um banco de filtros de síntese comum, isto é, uma grade de frequência Qδf . Para ilustrar essa interpretação, faz-se referência outra vez à figura 5b. Contudo, para essa ilustração, as faixas de origem 510 são consideradas como sendo subbandas intermediárias derivadas das sub-bandas de análise utilizando uma ordem de transposição T. Essas sub-bandas intermediárias têm uma grade de frequência dada por Tδf . Para gerar sinais de sub-banda de síntese em uma grade de frequência predefinida Qδf dada pelas faixas alvo 530, as faixas de origem 510, isto é, as sub-bandas intermediárias tendo a grade de frequência Tδf, precisam ser mapeadas para a grade de frequência predefinida Qδf . Isso pode ser realizado mediante determinação de uma faixa alvo 530, isto é, um sinal de sub-banda de síntese na grade de frequência QΔf, mediante interpolação de uma ou duas faixas de origem 510, isto é, sinais de sub-banda intermediária na grade de frequência Tδf . Em uma modalidade preferida, é utilizada uma interpolação linear, em que os pesos da interpolação são inversamente proporcionais à diferença entre a frequência central da faixa alvo 530 e a faixa de origem correspondente 510. Como exemplo, se a diferença for zero, então o peso é 1, e se a diferença for Tδf então o peso é 0.

[70] Em suma, um método de processamento não linear foidescrito o qual permite a determinação de contribuições para uma subbanda de síntese por intermédio de transposição de várias sub-bandas de análise. O método de processamento não linear possibilita o uso de grupos de filtro de sub-banda de análise e de síntese, comum, única para diferentes ordens de transposição, reduzindo assim significativamente a complexidade computacional dos transpositores múltiplos de harmônicos.

[71] As figuras 6a e 6b ilustram exemplos de grupos de filtros deanálise/síntese, exemplares utilizando uma FFT/DFT (Transformada Rápida de Fourier ou Transformada Discreta de Fourier) de M = 1024 pontos para ordens de transposição múltipla de T = 2,3,4. A figura 6a ilustra o caso convencional de um transpositor múltiplo de harmônicos 600 utilizando um banco de filtros de análise comum 601 e grupos de filtro de síntese separados 602, 603, 604 para cada fator detransposição T = 2,3,4. A figura 6a mostra a janela de análise 611 e as janelas de síntese v 612, 613, 614 aplicadas no banco de filtros de análise 601 e nos grupos de filtros de síntese 602, 603, 604, respectivamente. No exemplo ilustrado, a janela de análise vA611 tem um comprimento LA = 1024que é igual ao tamanho M da FFT ou DFT dos grupos de filtros de análise/síntese 601, 602, 603, 604. De uma maneira similar, as janelas de síntese v 612, 613, 614 têm um comprimento de LS = i024que é igual ao tamanho M da FFT ou DFT.

[72] A figura 6a ilustra também o tamanho de salto ΔsAempregado pelo banco de filtros de análise 601 e o tamanho de salto Δs empregado pelos grupos de filtros de síntese 602, 603, 604,respectivamente. O tamanho de salto Δs corresponde ao número de amostras de dados por intermédio das quais a janela respectiva 611, 612, 613, 614 é movida entre etapas de transformação sucessivas. O tamanho de salto Δs se refere ao passo de tempo físico Δt por intermédio da taxa de amostragem do sinal subjacente, isto é, Δs = fsΔt , em que f é a taxa de amostragem.

[73] Pode ser visto que a janela de análise 611 é movida por umtamanho de salto 621 de 128 amostras. A janela de síntese 612 correspondendo a uma transposição de ordem T=2 é movida por um tamanho de salto 622 de 256 amostras, isto é, um tamanho de salto 622 que é o dobro do tamanho de salto 621 da janela de análise 611. Conforme delineado acima, isso leva a uma dilatação de tempo do sinal pelo fator T=2. Alternativamente, se for suposta uma amostragem T=2 vezes superior, a diferença entre o tamanho de salto de análise 621 e o tamanho de salto de síntese 622 leva a uma transposição de harmônicos da ordem T=2. Isto é, uma dilatação de tempo por uma ordem T pode ser convertida em uma transposição de harmônicos mediante realização de uma conversão de taxa de amostragem de ordem T.

[74] De uma maneira similar, pode ser visto que o tamanho desalto de síntese 623 associado ao transpositor de harmônicos de ordem T=3 é T=3 vezes superior ao tamanho de salto de análise 621, e o tamanho de salto de síntese 624 associado ao transpositor de harmônicos de ordem T=4 é T=4 vezes superior ao tamanho de salto de análise 621. Para alinhar as taxas de amostragem do transpositor de 3a ordem e do transpositor de 4a ordem com a taxa de amostragem de saída do transpositor de 2a ordem, o transpositor de 3a ordem e o transpositor de 4a ordem compreendem um fator 3/2 - subamostrador 633 e um fator 2 - subamostrador 634, respectivamente. Em termos gerais, o transpositor de T ordem compreenderia um fator T/2 - subamostrador, se uma taxa de amostragem de saída for solicitada, a qual é 2 vezes superior à taxa de amostragem de entrada. Isto é, nenhuma subamostragem é exigida para o transpositor de harmônicos de ordem T=2.

[75] Finalmente, a figura 6a ilustra as unidades de modificaçãode fase separadas 642, 643, 644 para a ordem de transposição T=2, 3, 4, respectivamente. Essas unidades de modificação de fase 642, 643, 644 realizam uma multiplicação da fase dos sinais de sub-banda respectivos pela ordem de transposição T=2, 3, 4, respectivamente (vide Equação (1)).

[76] Uma estrutura de banco de filtros, combinada, eficiente parao transpositor pode ser obtida mediante limitação dos múltiplos transpositores da figura 6a a um único banco de filtros de análise 601 e um único banco de filtros de síntese 602. Os harmônicos de 3a e 4a ordem são então produzidos em uma unidade de processamento não linear 650 dentro de um banco de filtros de segunda ordem como ilustrado na figura 6b. A figura 6b mostra um banco de filtros de análise compreendendo uma unidade FFT direta de 1024 pontos 601 e uma janela de análise 611 a qual é aplicada no sinal de entrada x com um tamanho de salto de análise 621. O banco de filtros de síntese compreende uma unidade FFT inversa de 1024 pontos e uma janela 602 e uma janela de síntese 612 que é aplicada como um tamanho de salto de síntese 622. No exemplo ilustrado o tamanho d salto de síntese 622 é o dobro do tamanho de salto de análise 621. Adicionalmente, a taxa de amostragem do sinal de saída y é supostamente o dobro da taxa de amostragem do sinal de entrada x .

[77] O banco de filtros de análise/síntese da figura 6bcompreende um único de banco de filtros de análise e um único banco de filtros de síntese. Mediante uso de processamento não linearavançado 650 de acordo com os métodos delineados no contexto da figura 5 e da figura 5b, isto é, o processamento não linear avançado realizado nas unidades 502-1,...,502-P, esse banco de filtros de análise/síntese pode ser usado para fornecer um transpositor múltiplo, isto é, um transpositor de harmônicos para uma pluralidade de ordens de transposição T.

[78] Como delineado no contexto das figuras 5 e 5b, omapeamento de um a um das sub-bandas de análise para as subbandas de síntese correspondentes envolvendo uma multiplicação da fase dos sinais de sub-banda pela ordem de transposição respectiva T, pode ser generalizada para regras de interpolação (vide Equações (3) e (4)) envolvendo um ou mais sinais de sub-banda. Foi delineado que se o espaçamento físico Q Δf das sub-bandas de banco de filtros de síntese for Q vezes o espaçamento físico Δf do banco de filtros de análise, a entrada para a banda de síntese com índice né obtida a partir das bandas de análise com índices k e k +1. A relação entre os índices n e k é dada pela Equação (2) ou (5), dependendo de se os grupos de filtros são empilhados em número par ou em número ímpar. Uma interpolação geométrica para as magnitudes é aplicada com potências 1 -r e r (Equação (4)) e as fases são combinadas linearmente com pesos T(1 - r) e Tr(Equação (3)). Para o caso ilustrado onde Q=2 , os mapeamentos de fase para cada fator de transposição são ilustrados graficamente na figura 7.

[79] De uma maneira similar ao caso de Q=1 ilustrado na figura5, a sub-banda alvo ou faixa alvo 730 recebe contribuições a partir de até duas sub-bandas de origem ou faixas de origem 710. No caso T=Q=2, cada faixa de origem de fase modificada 711 é atribuída a uma faixa alvo correspondente 731. Para ordens de transposição superiores T>Q, uma faixa alvo 735 pode ser obtida a partir de uma faixa de origem de fase modificada correspondente 715. Esse é o caso se o resto r obtido a partir da Equação (2) ou (5) for zero. Caso contrário, a faixa alvo 732 é obtida mediante interpolação de duas faixas de origem de fase modificada 712 e 715.

[80] O processamento não linear mencionado acima é realizadona unidade de transpositor múltiplo 650 que determina as faixas alvo 730 para as diferentes ordens de transposição T=2, 3, 4 utilizando unidades de processamento não linear, avançadas 502-2, 502-3, 5024. Subsequentemente, faixas alvo, correspondentes 730 são combinadas em uma unidade de combinação 503 para produzir um único conjunto de sinais de sub-banda de síntese que são alimentados ao banco de filtros de síntese. Conforme delineado acima, a unidade de combinação 530 é configurada para combinar uma pluralidade de contribuições em faixas de frequência de sobreposição a partir da saída das diferentes unidades de processamento não linear 502-2, 502-3, 502-4.

[81] No que se segue é delineada a transposição de harmônicosde sinais transientes utilizando transpositores de harmônicos. Nesse contexto, deve-se observar que a transposição de harmônicos de ordem T utilizando grupos de filtros de análise/síntese pode ser interpretada como dilatação de tempo de um sinal subjacente por um fator de transposição de número inteiro T seguida por uma conversão de taxa de amostragem e/ou amostragem descendente. A dilatação de tempo é realizada de tal modo que frequências de senoides que compõem o sinal de entrada são mantidas. Tal dilatação de tempo pode ser realizada utilizando o banco de filtros de análise/síntese em combinação com modificação intermediária das fases dos sinais de sub-banda com base na ordem de transposição T . Conforme delineado acima, o banco de filtros de análise pode ser um banco de filtros DFT no modo de janela, com janela de análise v e banco de filtros de síntese pode ser um grupo de filtro DFT inversa no modo de janela, com janela de síntese v . Tal transformada de análise/síntese também é referida como Transformada de Fourier de curto prazo (STFT).

[82] Uma transformada de Fourier de curto prazo é realizada emum sinal de entrada de domínio de tempo x para obter uma sucessão de quadros espectrais sobrepostos. Para minimizar possíveis efeitos de banda secundários, janelas de análise/síntese apropriadas, por exemplo, janelas Gaussianas, janelas de Cosseno, janelas Hamming, janelas Hann, janelas retangulares, janelas Bartlett, janelas Blackman, e outras, deve, ser selecionadas. O retardo de tempo no qual cada quadro espectral é escolhido a partir do sinal de entrada x é referido como o tamanho de salto Av ou o passo de tempo físico Ar. A STFT do sinal de entrada x é referida como o estágio de análise e leva a uma representação de domínio de frequência do sinal de entrada x . A representação de domínio de frequência compreende uma pluralidade de sinais de sub-banda, em que cada sinal de sub-banda representa certo componente de frequência do sinal de entrada.

[83] Com o propósito de dilatação de tempo do sinal de entrada,cada sinal de sub-banda pode ser dilatado em tempo, por exemplo, mediante retardo das amostras de sinal de sub-banda. Isso pode ser obtido mediante uso de um tamanho de salto de síntese que é maior do que o tamanho de salto de análise. O sinal de domínio de tempo pode ser reconstruído mediante realização de uma transformada de Fourier (Rápida) inversa em todos os quadros seguida por um acúmulo sucessivo dos quadros. Essa operação do estágio de síntese é referida como operação de sobreposição/adição. O sinal de saída resultante é uma versão dilatada em tempo do sinal de entrada compreendendo os mesmos componentes de frequência que o sinal de entrada. Em outras palavras, o sinal de saída resultante tem a mesma composição espectral que o sinal de entrada, mas é mais lento do que o sinal de entrada, isto é, sua progressão é dilatada em tempo.

[84] A transposição para frequências superiores pode ser entãoobtida subsequentemente, ou de uma maneira integrada, através de subamostragem do sinal dilatado ou mediante realização de uma conversão de taxa de amostragem do sinal de saída dilatado em tempo. Como um resultado, o sinal transposto tem o comprimento em tempo do sinal inicial, mas compreende componentes de frequência que são deslocados para cima por um fator de transposição predefinido.

[85] Em decorrência do mencionado acima, a transposição deharmônicos de sinais transientes utilizando transpositores de harmônicos é descrita mediante consideração como um ponto inicial a dilatação de tempo de um sinal transiente protótipo, isto é, um pulso Dirac de tempo distinto em instante de tempo t = t0,

Mudanças nas unidades de medidasafetam o coeficentes por quê

[86] A transformada de Fourier de tal pulso Dirac tem magnitudeunitária e uma fase linear com uma inclinação proporcional a t :

Mudanças nas unidades de medidasafetam o coeficentes por quê

[87] em que

Mudanças nas unidades de medidasafetam o coeficentes por quê

é a frequência central do m0 sinal de submMbanda da análise de STFT e M é o tamanho da transformada de Fourier discreta (DFT). Tal transformada de Fourier pode ser considerada como o estágio de análise do banco de filtros de análise descrito acima, em que uma janela de análise plana v de duração infinita é utilizada. Para gerar um sinal de saída y o qual é dilatado em tempo por um fator T , isto é, um pulso Dirac δ(t-Tt0) no espaço de tempo t = Tt0, a fase dos sinais de sub-banda de análise deve ser multiplicada pelo fator T para se obter o sinal de sub-banda de síntese Y(Qm) = exp(-jQmTt0) o qual produz o pulso Dirac desejado δ(t-Tt0) como uma saída de uma Transformada de Fourier inversa.

[88] Contudo, deve-se observar que as considerações acima sereferem a um estágio de análise/síntese utilizando janelas de análise e síntese de comprimentos infinitos. Na realidade, um transpositor teórico com uma janela de duração infinita proporcionaria a dilatação correta de um pulso Dirac £( t -t0). Para uma análise no modo janela de duração finita, a situação é embaralhada pelo fato de que cada bloco de análise deve ser interpretado como intervalo de um período de um sinal periódico com um período igual ao tamanho da DFT.

[89] Isso é ilustrado na figura 8 que mostra a análise e síntese800 de um pulso Dirac £(t-t0). A parte superior da figura 8 mostra a entrada para o estágio de análise 810 e a parte inferior da figura 8 mostra a saída do estágio de síntese 820. Os gráficos, superior e inferior, representam o domínio de tempo. A janela de análise estilizada 811 e a janela de síntese 821 são ilustradas como janelas triangulares (Bartlett). O pulso de entrada 3(t-t0) 812 no espaço de tempo t = t0 é ilustrado no gráfico superior 810 como uma seta vertical. Supõe-se que o bloco de transformada DFT é de tamanho M =L=L =L , isto é, o tamanho da transformada DFT é escolhido para ser igual ao tamanho das janelas. A multiplicação de fase dos sinais de sub-banda pelo fator Tproduzirá a análise DFT de um pulso Dirac δ(t-Tt0) em t = Tt0, contudo, um pulso Dirac periodizado para um conjunto de pulsos Dirac com período L . Isso se deve ao comprimento finito da janela aplicada e a transformada Fourier. O conjunto de pulso periodizado com período L é ilustrado pelas setas tracejadas 823, 824 no gráfico inferior.

[90] Em um sistema de realidade, o conjunto de pulsos contémna realidade apenas uns poucos pulsos (dependendo do fator de transposição), um pulso principal, isto é, o termo desejado, uns poucos pré-pulsos e uns poucos pós-pulsos, isto é, os termos indesejados. Os pré e pós-pulsos emergem porque a DFT é periódica (com L). Quando um pulso está localizado dentro de uma janela de análise, de modo que a fase complexa é encoberta quando multiplicada por T (isto é, o pulso é deslocado para fora da extremidade da janela e retorna para o início), um pulso indesejado emerge dentro da janela de síntese. Os pulsos indesejados podem ter, ou podem não ter, a mesma polaridade que o pulso de entrada, dependendo da localização na janela de análise e do fator de transposição.

[91] No exemplo da figura 8, o janelamento de síntese utilizajanela finita v 821. A janela de síntese finita 821 escolhe o pulso desejado δ(t -Tt0) em t = Tt0 que é ilustrado como uma seta sólida 822 e cancela as outras contribuições indesejadas as quais são mostradas como setas tracejadas 823, 824.

[92] À medida que o estágio de análise e síntese se move aolongo do eixo de tempo de acordo com o fator de salto Δs ou como o passo de tempo Δt, o pulso δ( t -t0) 812 terá outra posição em relação ao centro da janela de análise respectiva 811. Como delineado acima, a operação para obter dilatação de tempo consiste em mover o pulso 812 para T vezes sua posição em relação ao centro da janela. Desde que essa posição esteja dentro da janela 821, essa operação de dilatação de tempo garante que todas as contribuições acrescentem a um único pulso sintetizado dilatado em tempoδ(t-Tt0) em t = Tt0.

[93] Contudo, ocorre um problema para a situação da figura 9,onde o pulso δ( t -t0) 912 se desloca ainda mais para fora em direção à borda do bloco DFT. A figura 9 ilustra uma configuração de análise/síntese similar 900 conforme a figura 8. O gráfico superior 910 mostra a entrada para o estágio de análise e a janela de análise 911, e o gráfico inferior 920 ilustram a saída do estágio de síntese e a janela de síntese 921. Quando dilatando em tempo o pulso Dirac de entrada 912 por um fator T, o pulso Dirac dilatado em tempo 922, isto é, J(t-Tt0) , fica situado fora da janela de síntese 921. Ao mesmo tempo, outro pulso Dirac pulse 924 do conjunto de pulsos, isto é, £(t-Tt0 + L) no espaço de tempo t = Tt0 -L, é escolhido pela janela de síntese. Em outras palavras o pulso Dirac de entrada 912 não é retardado para T vezes um espaço de tempo posterior, mas é movido para frente para um espaço de tempo que está situado antes do pulso Dirac de entrada 912. O efeito final sobre o sinal de áudio é a ocorrência de um pré-eco em uma distância de tempo da escala das janelas de transpositor mais propriamente longas, isto é, em um espaço de tempo t = Tt -L o qual é L-(T-1)t mais cedo do que o pulso Dirac de entrada 912.

[94] O princípio da solução para esse problema é descrito comreferência à figura 10. A figura 10 ilustra um cenário de análise/síntese 1000, similar à figura 9. O gráfico superior 1010 mostra a entrada para o estágio de análise com a janela de análise 1011, e o gráfico inferior 1020 mostra a saída do estágio de síntese com a janela de síntese 1021. O tamanho DFT é adaptado de modo a evitar pré-ecos. Isso pode ser obtido mediante ajuste do tamanho Mda DFT de tal modo que nenhuma imagem de pulso Dirac indesejada a partir do conjunto de pulsos resultantes é escolhida pela janela de síntese. O tamanho da transformada DFT 1001 é aumentado para M = FL , onde L é o comprimento da função de janela 1002 e o fator F é um fator de sobreamostragem de domínio de frequência. Em outras palavras, o tamanho da transformada DFT 1001 é selecionado para ser maior do que o tamanho de janela 1002. Particularmente, o tamanho da transformada DFT 1001 pode ser selecionado para ser maior do que o tamanho de janela 1002 da janela de síntese. Devido ao comprimento aumentado 1001da transformada DFT, o período do conjunto de pulso compreendendo os pulsos Dirac 1022, 1024 é FL . Mediante seleção de um valor suficientemente grande de F , isto é, mediante seleção de um fator de sobreamostragem de domínio de frequência suficientemente grande, contribuições indesejadas para a dilatação de pulso podem ser canceladas. Isso é mostrado na figura 10, onde o pulso Dirac 1024 no espaço de tempo t = Tt0 - FL está situado fora da janela de síntese 1021. Portanto, o pulso Dirac 1024 não é escolhido pela janela de síntese 1021 e como consequência, os pré-ecos podem ser evitados.

[95] Deve-se observar que em uma modalidade preferida, ajanela de síntese e a janela de análise têm comprimentos "nominais" iguais (medidos no número de amostras). Contudo, ao utilizar reamostragem implícita do sinal de saída mediante descarte ou inserção de amostra nas bandas de frequência do banco de filtros ou transformada, o tamanho de janela de síntese (medido no número de amostras) será tipicamente diferente do tamanho de análise, dependendo do fator de reamostragem e/ou transposição.

[96] O valor mínimo de F , isto é, o fator de sobreamostragem dedomínio de frequência mínimo, pode ser deduzido a partir da figura 10. A condição para não pegar as imagens de pulso Dirac indesejadas pode ser formulada como a seguir: Para qualquer pulso de entrada £(t-t0) na posição t = t0 < L, isto é, para qualquer pulso de entrada compreendido dentro da janela de análise 1011, a imagem indesejada £(t-Tt0 + FL) no espaço de tempo t = Tt -FL deve estar localizada para a esquerda da borda esquerda da janela de síntese em t = -L. De uma maneira equivalente, a condição TL - FL <-L deve ser satisfeita, o que leva à regra

Mudanças nas unidades de medidasafetam o coeficentes por quê

[97]Conforme pode ser visto a partir da fórmula (6), o fator de sobreamostragem de domínio de frequência mínimo F é uma função da ordem de transposição T . Mais especificamente, o fator de sobreamostragem de domínio de frequência mínimo F é proporcional à ordem de transposição T .

[98] Mediante repetição da linha de pensamento acima para ocaso onde as janelas de análise e síntese têm comprimentos diferentes se pode obter uma fórmula mais geral. Deixemos L e Ls ser os comprimentos das janelas de análise e de síntese (medidas no número de amostras), respectivamente, e deixemos M ser o tamanho DFT empregado. A fórmula de extensão da regra geral (6) é então

Mudanças nas unidades de medidasafetam o coeficentes por quê

[99] Que essa regra na realidade é uma extensão de (6) pode serverificado mediante inserção de M=FL, e L = Ls = L em (7) e dividindo por L em ambos os lados da equação resultante.

[100] A análise acima é realizada por um modelo mais propriamenteespecial de um transiente, isto é, um pulso Dirac. Contudo, o raciocínio pode ser estendido para mostrar que ao usar o esquema de transposição de dilatação de harmônicos e/ou dilatação de tempo descrito acima, sinais de entrada que têm um envelope espectral quase plano e que desaparecem fora de um intervalo de tempo [a,b] serão dilatados para produzir sinais que são pequenos fora do intervalo Ta, Tb ]. Também pode ser verificado, mediante estudo de espectrogramas de sinais de áudio e/ou fala reais, que os pré-ecos desaparecem nos sinais dilatados ou transpostos quando a regra descrita acima para selecionar um fator de sobreamostragem de domínio de frequência apropriado é respeitado. Uma análise mais quantitativa também revela que os pré-ecos ainda são reduzidos ao utilizar fatores de sobreamostragem de domínio de frequência que são ligeiramente inferiores ao valor imposto pela condição da fórmula (6) ou (7). Isso se deve ao fato de que funções típicas de janela v são pequenas próximas às suas bordas; desse modo atenuando os pré-ecos indesejados que estão posicionados próximos às bordas das funções de janela.

[101] Em resumo, uma forma de aperfeiçoar a resposta detransiente de transpositores de harmônicos de domínio de frequência, ou dilatadores de tempo, foi descrita mediante introdução de uma transformada sobreamostrada, onde a quantidade de sobreamostragem é uma função do fator de transposição escolhido. A resposta de transiente aperfeiçoada do transpositor é obtida por intermédio de sobreamostragem de domínio de frequência.

[102] No transpositor múltiplo da figura 6, a sobreamostragem dedomínio de frequência pode ser implementada mediante uso de rotinas de instruções básicas de DFT 601, 602, 603, 604 de comprimento 1024F e mediante enchimento zero das janelas de análise e síntese simetricamente até aquele comprimento. Seria observado que por razões de complexidade, é vantajoso manter baixa a quantidade de sobreamostragem. Se a fórmula (6) for aplicada ao transpositor múltiplo da figura 6, um fator de sobreamostragem F=2,5 deve ser aplicado para cobrir todos os fatores de transposição T=2, 3, 4. Contudo, pode ser mostrado que o uso de F=2,0 já conduz a um aperfeiçoamento de qualidade significativa para os sinais de áudio reais.

[103] No que se segue, é descrito o uso de sobreamostragem dedomínio de frequência no contexto de grupos de filtros de análise/síntese combinadas, tal como descrito no contexto das figuras 5 ou 6b.

[104] Em geral, para um banco de filtros de transposiçãocombinada onde o espaçamento físico QΔf das sub-bandas de banco de filtros de síntese é Q vezes o espaçamento físico Δf do banco de filtros de análise e onde a duração da janela de análise física D (medida em unidades de tempo, por exemplo, segundos) também é Q vezes àquela do banco de filtros, D = QDS, a análise para o pulso Dirac conforme acima se aplicará para todos os fatores de transposição T = Q,Q+1,Q+2,... como se T = Q. Em outras palavras, a regra para o grau de sobreamostragem de domínio de frequência exigida em um banco de filtros de transposição combinada é dada por

Mudanças nas unidades de medidasafetam o coeficentes por quê

[105] Particularmente, deve ser observado que para T > Q , o fatorT +1de sobreamostragem de domínio de frequência

Mudanças nas unidades de medidasafetam o coeficentes por quê

é suficiente, enquanto garantindo ainda a supressão dos artefatos nos sinais de transiente causados por transposição de harmônicos de ordem T . Isto é, utilizando-se as regras de sobreamostragem acima para o banco de filtros combinados, pode ser visto que mesmo ao utilizar ordens de transposição superiores T>Q, não é exigido aumentar ainda mais o fator de sobreamostragem F. Conforme indicado pela equação (6b), é suficiente na implementação de banco de filtros combinados da figura 6b utilizar um fator de sobreamostragem F=1,5 para evitar a ocorrência dos pré-ecos. Esse valor é inferior ao fator de sobreamosrtagem F=2,5 exigido para o transpositor múltiplo da figura 6. Consequentemente, a complexidade de realização de sobreamostragem de domínio de frequência para aperfeiçoar o desempenho de transiente de múltiplos transpônderes de harmônicos pode ser adicionalmente reduzido ao se utilizar um banco de filtros de análise/síntese combinadas (em vez de grupos de filtros de análise e/ou síntese separados para as diferentes ordens de transposição).

[106] Em um cenário mais geral, a duração de tempo físico dasjanelas de análise e síntese DA e DS , respectivamente, pode ser selecionado arbitrariamente. Então o espaçamento físico Δf das subbandas de banco de filtros de análise deve satisfazer

Mudanças nas unidades de medidasafetam o coeficentes por quê

[107] para evitar os artefatos descritos causados pela transposiçãode harmônicos. Deve-se observar que a duração de uma janela Dtipicamente difere do comprimento de uma janela L . Enquanto o comprimento de uma janela L corresponde ao número de amostras de sinal cobertas pela janela, a duração da janela Dcorresponde ao intervalo de tempo do sinal coberto pela janela. Conforme ilustrado na figura 6a, as janelas 611, 612, 613, 614 têm um comprimento igual de L = 1024 amostras. Contudo, a duração D da janela de análise 611 é T vezes a duração D da janela de síntese 612, 613, 614, em que T é a ordem de transposição respectiva e o fator de resolução do banco de filtros de síntese, respectivo. De uma maneira similar, a duração D da janela de análise 611 na figura 6b é Q vezes a duração D da janela de síntese 612, em que Q é o fator de resolução do banco de filtros de síntese. A duração de uma janela D é relacionada ao comprimento da janela L por intermédio da frequência de amostragem fs, isto é,notavelmente D = —. De uma maneira similar, a resolução de fsfrequência de uma transformada Δf é relacionada ao número de pontos ou comprimento M da transformada por intermédio da frequência de amostragem fs, isto é, notavelmente Δf = f±. Além disso, o passo de Mtempo físico Δtdo banco de filtros é relacionado ao tamanho de salto Δs do banco de filtros por intermédio da frequência de amostragem fs, istoé, notavelmente Δ t = —.f s

[108] Utilizando as relações acima, a equação (6b) pode serescrita como

Mudanças nas unidades de medidasafetam o coeficentes por quê

[109] isto é, o produto da resolução de frequência e o comprimentode janela do banco de filtros de análise e/ou resolução de frequência e o comprimento de janela do banco de filtros de síntese deve ser selecionado para ser menor ou igual a ——. Para T >Q , o produto ΔfDAQ +1 A “e/ou QΔDS pode ser selecionado para ser maior do que , reduzindo assim a complexidade computacional dos grupos de filtros.

[110] No presente documento, vários métodos para realizartransposição de harmônicos de sinais, preferivelmente sinais de áudio e/ou fala, foram descritos. Ênfase específica foi colocada na complexidade computacional dos transpositores múltiplos de harmônicos. Nesse contexto, um transpositor múltiplo foi descrito, o qual é configurado para realizar múltiplas ordens de transposição utilizando um banco de filtros de análise/síntese, isto e, um banco de filtros compreendendo um único banco de filtros de análise e um único grupo de filtro de síntese. Um transpositor múltiplo utilizando um banco de filtros de análise/síntese reduziu a complexidade computacional em comparação com um transpositor múltiplo convencional. Além disso, a sobrea- mostragem de domínio de frequência foi descrita no contexto de grupos de filtros de análise/síntese combinados. A sobreamostragem de domínio de frequência pode ser usada para reduzir ou remover os artefatos causados nos sinais transientes mediante transposição de harmônicos. Foi mostrado que sobreamostragem de domínio de frequência pode ser implementada em complexidade computacional reduzida dentro dos grupos de filtros de análise/síntese combinadas, em comparação com implementações de transpositores múltiplos convencionais.

[111] Embora modalidades específicas da presente invenção eaplicações da invenção tenham sido aqui descritas, será evidente para aqueles de conhecimento comum na técnica que muitas variações nas modalidades e aplicações descritas aqui são possíveis sem se afastar do escopo da invenção aqui descrito e reivindicado. Deve-se entender que embora certas formas da invenção tenham sido mostradas e descritas, a invenção não deve ser limitada às modalidades específicas descritas e mostradas ou aos métodos específicos descritos.

[112] Os métodos e sistemas descritos no presente documentopodem ser implementados como software, firmware e/ou hardware. Certos componentes podem, por exemplo, ser implementados como software executando e um processador ou microprocessador de sinais digitais. Outros componentes podem, por exemplo, ser implementados como hardware e/ou como circuitos integrados de aplicação específica. Os sinais encontrados nos métodos e sistemas descritos podem ser armazenados em meios tais como memória de acesso aleatório; ou meios de armazenamento ótico. Eles podem ser transferidos por intermédio de redes, tais como: redes de rádio, redes por satélite, redes sem fio ou redes cabeadas, por exemplo, a Internet. Dispositivos típicos fazendo uso dos métodos descritos no presente documento são, por exemplo, aparelhos de reprodução de meios ou conversores de sinais de frequência que decodificam os sinais de áudio. Pelo lado da codificação, os sistemas e métodos podem ser usados, por exemplo, em estações de transmissão e em locais de produção de multimídia.