Hier is mijn probleem. Ik heb een aantal wav-bestanden. Ik gebruik de wavs als invoer om de fbanks te berekenen. Dan wil ik doen wat dingen met de fbanks en dan wil ik een wav-bestand opnieuw maken dat is gekoppeld aan de nieuwe fbank. Ik ben me ervan bewust dat de fbank de fase-informatie niet heeft, maar aangezien ik een origineel bestand heb, kan ik (theoretisch) de fase uit het originele wav-bestand.
Om de fbank te berekenen uit de wavs die ik gebruik:
python_speech_features.fbank()
Is er een manier om dit te doen ?
mel_to_stft
, gevolgd dooristft
zodat je de originele fase kunt gebruiken.