Tady je můj problém. Mám nějaké soubory wav. Pro výpočet fbanks používám wav jako vstup. Pak chci udělat nějaké věci s fbanks a pak chci znovu vytvořit soubor wav přidružený k nové fbance. Jsem si vědom, že fbank nemá informace o fázi, ale protože mám původní soubor, mohu (teoreticky) extrahovat fáze z původního souboru wav.
Chcete-li vypočítat fbank z wavů, které používám:
python_speech_features.fbank()
Existuje způsob, jak to udělat ?
mel_to_stft
, následovanýistft
, abyste mohli využít původní fázi.