Her er problemet mitt. Jeg har noen wav-filer. Jeg bruker wavs som input for å beregne fbanks. Så vil jeg gjøre noen ting med fbankene, og så vil jeg gjenskape en wav-fil tilknyttet den nye fbanken. Jeg er klar over at fbanken ikke har faseinformasjonen, men siden jeg har en originalfil, kan jeg (teoretisk sett) trekke ut fase fra den opprinnelige wav-filen.
For å beregne fbank fra wavs bruker jeg:
python_speech_features.fbank()
Er det en måte å gjøre det ?
mel_to_stft
, etterfulgt avistft
slik at du kan bruke den opprinnelige fasen.