Fbank retour à wav | Complex Solutions

Voici mon problème. Jai quelques fichiers wav. Jutilise les wavs comme entrée pour calculer les fbanks. Alors je veux faire des trucs avec les fbanks et ensuite je veux recréer un fichier wav associé à la nouvelle fbank. Je suis conscient que la fbank na pas les informations de phase, cependant, comme jai un fichier original, je peux (théoriquement) extraire le phase du fichier wav dorigine.

Pour calculer la fbank à partir des wav, jutilise:

python_speech_features.fbank()

Y a-t-il un moyen de le faire ?

Commentaires

De quelle banque de filtres parlez-vous, mel-scale? Je ne connais pas la bibliothèque que vous utilisez, mais librosa a tout ce dont vous avez besoin. Vous pouvez calculer le spectrogramme mel en utilisant melspectrogram et linverser directement en audio en utilisant mel_to_audio ou utilisez mel_to_stft, suivi de istft pour pouvoir utiliser la phase dorigine.

Commentaires

Laisser un commentaire Annuler la réponse