Aqui está o meu problema. Eu tenho alguns arquivos wav. Eu uso o wavs como entrada para calcular os fbanks. Então eu quero fazer algumas coisas com o fbanks e depois quero recriar um arquivo wav associado ao novo fbank. Estou ciente de que o fbank não tem as informações de fase, no entanto, como tenho um arquivo original, posso (teoricamente) extrair o fase do arquivo wav original.
Para calcular o fbank a partir dos wavs que eu uso:
python_speech_features.fbank()
Existe uma maneira de fazer isso ?
mel_to_stft
, seguido deistft
para que possa utilizar a fase original.