Her er mit problem. Jeg har nogle wav-filer. Jeg bruger wavs som input til at beregne fbanks. Så vil jeg gøre nogle ting med fbanks, og så vil jeg genskabe en wav-fil, der er knyttet til den nye fbank. Jeg er opmærksom på, at fbank ikke har faseoplysningerne, men da jeg har en original fil, kan jeg (teoretisk) udtrække fase fra den oprindelige wav-fil.
For at beregne fbank ud fra de wavs, jeg bruger:
python_speech_features.fbank()
Er der en måde at gøre det på ?
mel_to_stft
, efterfulgt afistft
, så du kan bruge den oprindelige fase.