Tässä on ongelmani. Minulla on joitain wav-tiedostoja. Käytän wav-tiedostoja syötteenä fbankkien laskemiseen. Sitten haluan tehdä joitain juttuja fbankeista ja sitten haluan luoda uudelle fbankille liitetyn wav-tiedoston. Tiedän, että fbankilla ei ole vaihetietoja, mutta koska minulla on alkuperäinen tiedosto, voin (teoreettisesti) purkaa vaihe alkuperäisestä wav-tiedostosta.

Fbank lasketaan käytetyistä wav-tiedostoista:

python_speech_features.fbank() 

Onko olemassa tapa tehdä niin ?

Kommentit

  • Mihin suodatinpankkiin tarkoitat, mel-scale? En ole perehtynyt käyttämääsi kirjastoon, mutta librosassa on kaikki tarvitsemasi. Voit laskea mel-spektrogrammin käyttämällä melspectrogram -ohjelmaa ja kääntää sen suoraan ääneksi käyttämällä mel_to_audio tai käytä mel_to_stft ja sen jälkeen istft, jotta voit käyttää alkuperäistä vaihetta.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *