La pagina di wikipedia per la funzione / formula della differenza di grandezza media (AMDF) sembra essere vuota. Cosè un AMDF? Quali sono le proprietà di AMDF? Quali sono i punti di forza e di debolezza di AMDF, rispetto ad altri metodi di stima del tono come lautocorrelazione?
Commenti
- Questo documento è molto utile.
Risposta
Non ho mai visto la parola “Formula” con “AMDF”. La mia comprensione della definizione di AMDF è
$$ Q_x [k, n_0] \ triangleq \ frac {1} {N} \ sum \ limits_ {n = 0} ^ {N-1} \ Big | x [n + n_0] – x [n + n_0 + k] \ Big | $$
$ n_0 $ è il quartiere di interesse in $ x [n] $ . Tieni presente che stai riassumendo solo termini non negativi. Quindi $ Q_x [k, n_0] \ ge 0 $ . Chiamiamo “ $ k $ ” il “lag” . Chiaramente se $ k = 0 $ , quindi $ Q_x [0, n_0] = 0 $ . Inoltre, se $ x [n] $ è periodico con punto $ P $ (e per il momento fingiamo che $ P $ è un numero intero) quindi $ Q_x [P, n_0] = 0 $ e $ Q_x [mP, n_0] = 0 $ per qualsiasi numero intero $ m $ .
Ora anche se $ x [n] $ non è precisamente periodico, o se il periodo non è precisamente un numero intero di campioni (alla particolare frequenza di campionamento che stai utilizzando), noi si aspetterebbe $ Q_x [k, n_0] \ circa 0 $ per qualsiasi ritardo $ k $ vicino al periodo o qualsiasi multiplo intero del periodo. Infatti, se $ x [n] $ è quasi periodico, ma il periodo non è un numero intero di campioni, ci aspettiamo di poter interpolare $ Q_x [k, n_0] $ tra i valori interi di $ k $ per ottenere un minimo ancora più basso.
Il mio preferito non è AMDF ma “ASDF” (indovina cosa significa “S”?)
$$ Q_x [k, n_0 ] \ triangleq \ frac {1} {N} \ sum \ limits_ {n = 0} ^ {N-1} \ big (x [n + n_0] – x [n + n_0 + k] \ big) ^ 2 $ $
Risulta che puoi fare il calcolo con quello perché la funzione quadrato ha derivate continue, ma la funzione del valore assoluto no.
Ecco un altro motivo per cui mi piace ASDF è migliore di AMDF. Se $ N $ è molto grande e giochiamo un po velocemente con i limiti della somma:
$$ \ begin {align} Q_x [k] & = \ frac {1} {N} \ left (\ sum_n \ big (x [n] – x [n + k] \ big) ^ 2 \ right) \\ & = \ frac {1} {N} \ left (\ sum_n (x [n]) ^ 2 + \ sum_n (x [ n + k]) ^ 2 – 2 \ sum_n x [n] x [n + k] \ right) \\ & = \ frac {1} {N} \ sum_n ( x [n]) ^ 2 + \ frac {1} {N} \ sum_n (x [n + k]) ^ 2 – \ frac {2} {N} \, \ sum_n x [n] x [n + k ] \\ & = \ overline {x ^ 2 [n]} + \ overline {x ^ 2 [n]} – 2 \, R_x [k] \\ & = 2 \ left (\ overline {x ^ 2 [n]} – R_x [k] \ right) \\ \ end {align} $$
dove
$$ \ begin {align} R_x [k] & \ triangleq \ frac {1} {N} \ sum_n x [n] x [n + k] \\ & = \ overline {x ^ 2 [n]} – \ tfrac {1} {2} Q_x [k] \\ & = R_x [0] – \ tfrac {1} {2} Q_x [k] \\ \ end {align} $$
è normalmente identificato come “autocorrelazione” di $ x [n] $ .
Quindi ci aspettiamo che la funzione di autocorrelazione sia una replica capovolta (e offset) dellASDF. Ovunque i picchi di autocorrelazione è dove lASDF (e di solito anche lAMDF) ha un minimo.