Iată problema mea. Am câteva fișiere wav. Folosesc wav-urile ca intrare pentru a calcula bancurile. Apoi vreau să fac unele lucruri cu fbanks și apoi vreau să recreez un fișier wav asociat noii fbank. Sunt conștient de faptul că fbank nu are informațiile de fază, totuși, deoarece am un fișier original, pot (teoretic) extrage fază din fișierul wav original.
Pentru a calcula fbank din wav-urile pe care le folosesc:
python_speech_features.fbank()
Există o modalitate de a face acest lucru ?
mel_to_stft
, urmat deistft
, astfel încât să puteți utiliza faza inițială.