Hier is mijn probleem. Ik heb een aantal wav-bestanden. Ik gebruik de wavs als invoer om de fbanks te berekenen. Dan wil ik doen wat dingen met de fbanks en dan wil ik een wav-bestand opnieuw maken dat is gekoppeld aan de nieuwe fbank. Ik ben me ervan bewust dat de fbank de fase-informatie niet heeft, maar aangezien ik een origineel bestand heb, kan ik (theoretisch) de fase uit het originele wav-bestand.

Om de fbank te berekenen uit de wavs die ik gebruik:

python_speech_features.fbank() 

Is er een manier om dit te doen ?

Reacties

  • Naar welke filterbank verwijst u, mel-scale? Ik ben niet bekend met de bibliotheek die u gebruikt, maar librosa heeft alles wat u nodig heeft. U kunt het mel-spectrogram berekenen met melspectrogram en het rechtstreeks omkeren naar audio met mel_to_audio of gebruik mel_to_stft, gevolgd door istft zodat je de originele fase kunt gebruiken.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *