Itt a problémám. Van néhány wav fájlom. A wav-okat bemenetként használom az fbanks kiszámításához. Aztán meg akarom csinálni néhány dolog a fbanks-szal, majd szeretnék létrehozni egy wav fájlt az új fbankhoz társítva. Tisztában vagyok azzal, hogy a fbanknak nincsenek fázisinformációi, azonban mivel eredeti fájlom van, (elméletileg) kibonthatom az szakasz az eredeti wav fájlból.

Az Fbank kiszámításához az általam használt wav-okból:

python_speech_features.fbank() 

Van rá mód ?

Megjegyzések

  • Milyen szűrőbankra hivatkozik, mel-scale? Nem ismerem az általad használt könyvtárat, de a librosa mindent megtalál, amire szüksége van. Kiszámíthatja a mel-spektrogramot a melspectrogram segítségével, és invertálhatja közvetlenül audióra a mel_to_audio vagy használja az mel_to_stft elemet, majd a következőt: istft, hogy az eredeti fázist felhasználhassa.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük