Itt a problémám. Van néhány wav fájlom. A wav-okat bemenetként használom az fbanks kiszámításához. Aztán meg akarom csinálni néhány dolog a fbanks-szal, majd szeretnék létrehozni egy wav fájlt az új fbankhoz társítva. Tisztában vagyok azzal, hogy a fbanknak nincsenek fázisinformációi, azonban mivel eredeti fájlom van, (elméletileg) kibonthatom az szakasz az eredeti wav fájlból.
Az Fbank kiszámításához az általam használt wav-okból:
python_speech_features.fbank()
Van rá mód ?
mel_to_stft
elemet, majd a következőt:istft
, hogy az eredeti fázist felhasználhassa.