Her er mit problem. Jeg har nogle wav-filer. Jeg bruger wavs som input til at beregne fbanks. Så vil jeg gøre nogle ting med fbanks, og så vil jeg genskabe en wav-fil, der er knyttet til den nye fbank. Jeg er opmærksom på, at fbank ikke har faseoplysningerne, men da jeg har en original fil, kan jeg (teoretisk) udtrække fase fra den oprindelige wav-fil.

For at beregne fbank ud fra de wavs, jeg bruger:

python_speech_features.fbank() 

Er der en måde at gøre det på ?

Kommentarer

  • Hvilken filterbank refererer du til, mel-skala? Jeg kender ikke det bibliotek, du bruger, men librosa har alt, hvad du har brug for. Du kan beregne mel-spektrogrammet ved hjælp af melspectrogram og invertere det direkte til lyd ved hjælp af mel_to_audio eller brug mel_to_stft, efterfulgt af istft, så du kan bruge den oprindelige fase.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *