Ecco il mio problema. Ho alcuni file wav. Uso i wav come input per calcolare gli fbank. Quindi voglio fare alcune cose con fbanks e poi voglio ricreare un file wav associato al nuovo fbank. Sono consapevole che fbank non ha le informazioni sulla fase, tuttavia, dato che ho un file originale, posso (teoricamente) estrarre il fase dal file wav originale.
Per calcolare fbank dai wav che uso:
python_speech_features.fbank()
Cè un modo per farlo ?
mel_to_stft
, seguito daistft
in modo da poter utilizzare la fase originale.