Voici mon problème. Jai quelques fichiers wav. Jutilise les wavs comme entrée pour calculer les fbanks. Alors je veux faire des trucs avec les fbanks et ensuite je veux recréer un fichier wav associé à la nouvelle fbank. Je suis conscient que la fbank na pas les informations de phase, cependant, comme jai un fichier original, je peux (théoriquement) extraire le phase du fichier wav dorigine.

Pour calculer la fbank à partir des wav, jutilise:

python_speech_features.fbank() 

Y a-t-il un moyen de le faire ?

Commentaires

  • De quelle banque de filtres parlez-vous, mel-scale? Je ne connais pas la bibliothèque que vous utilisez, mais librosa a tout ce dont vous avez besoin. Vous pouvez calculer le spectrogramme mel en utilisant melspectrogram et linverser directement en audio en utilisant mel_to_audio ou utilisez mel_to_stft, suivi de istft pour pouvoir utiliser la phase dorigine.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *