Voici mon problème. Jai quelques fichiers wav. Jutilise les wavs comme entrée pour calculer les fbanks. Alors je veux faire des trucs avec les fbanks et ensuite je veux recréer un fichier wav associé à la nouvelle fbank. Je suis conscient que la fbank na pas les informations de phase, cependant, comme jai un fichier original, je peux (théoriquement) extraire le phase du fichier wav dorigine.
Pour calculer la fbank à partir des wav, jutilise:
python_speech_features.fbank()
Y a-t-il un moyen de le faire ?
mel_to_stft
, suivi deistft
pour pouvoir utiliser la phase dorigine.