Tady je můj problém. Mám nějaké soubory wav. Pro výpočet fbanks používám wav jako vstup. Pak chci udělat nějaké věci s fbanks a pak chci znovu vytvořit soubor wav přidružený k nové fbance. Jsem si vědom, že fbank nemá informace o fázi, ale protože mám původní soubor, mohu (teoreticky) extrahovat fáze z původního souboru wav.

Chcete-li vypočítat fbank z wavů, které používám:

python_speech_features.fbank() 

Existuje způsob, jak to udělat ?

Komentáře

  • Na jakou banku filtrů máte na mysli mel-scale? Nejsem obeznámen s knihovnou, kterou používáte, ale librosa má vše, co potřebujete. Mel-spektrogram můžete vypočítat pomocí melspectrogram a převést jej přímo do zvuku pomocí mel_to_audio nebo použijte mel_to_stft, následovaný istft, abyste mohli využít původní fázi.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *