Qual è la definizione di “feature space”?
Ad esempio, quando leggo di SVM, leggo di “mapping to feature spazio”. Quando leggo di CART, leggo di “partizionamento per lo spazio delle caratteristiche”.
Capisco cosa sta succedendo, specialmente per CART, ma penso che ci sia una definizione che mi è sfuggita.
Esiste una definizione generale di “spazio delle funzionalità”?
Esiste una definizione che mi darà maggiori informazioni sui kernel SVM e / o sul CART?
Commenti
- Lo spazio per gli elementi si riferisce solo alle raccolte di elementi utilizzati per caratterizzare i tuoi dati. Ad esempio, se i tuoi dati riguardano le persone, lo spazio per gli elementi potrebbe essere (Sesso, Altezza, Peso, età). In un SVM, potremmo voler considerare un diverso insieme di caratteristiche per descrivere i dati, come (Sesso, Altezza, Peso, Età ^ 2, Altezza / Peso) ecc; questa è la mappatura a unaltra caratteristica spazio
- Puoi fornire i nomi / i titoli delle tue letture?
Risposta
Feature Space
Feature space si riferisce alle $ n $ -dimensioni in cui vivono le variabili (esclusa una variabile di destinazione, se presente). Il termine è usato spesso nella letteratura ML perché unattività in ML è estrazione di caratteristiche , quindi vediamo tutte le variabili come caratteristiche. Ad esempio, considera il set di dati con:
Target
- $ Y \ equiv $ Spessore degli pneumatici per auto dopo un certo periodo di test
Variabili
- $ X_1 \ equiv $ distanza percorsa nel test
- $ X_2 \ equiv $ durata del test
- $ X_3 \ equiv $ quantità di sostanza chimica $ C $ in pneumatici
Lo spazio delle caratteristiche è $ \ mathbf {R} ^ 3 $ o, più precisamente, il quadrante positivo in $ \ mathbf {R} ^ 3 $ come tutti i Le variabili $ X $ possono essere solo quantità positive. La conoscenza del dominio sugli pneumatici potrebbe suggerire che la velocità a cui si muoveva il veicolo è importante, quindi generiamo unaltra variabile, $ X_4 $ (questa è la parte di estrazione delle caratteristiche):
- $ X_4 = \ frac {X_1} {X_2} \ equiv $ la velocità del veicolo durante il test.
Questo estende il nostro vecchio spazio di funzionalità in uno nuovo, la parte positiva di $ \ mathbf {R} ^ 4 $.
Mappature
Inoltre, una mappatura nel nostro esempio è una funzione, $ \ phi $, da $ \ mathbf {R} ^ 3 $ a $ \ mathbf {R} ^ 4 $:
$$ \ phi (x_1, x_2, x_3) = (x_1, x_2, x_3, \ frac {x_1} {x_2}) $$
Commenti
- In che modo questo differisce da uno spazio campionario nella teoria della probabilità? Solo per chiedere. Mi piacerebbe saperlo.
- ' è molto simile, se non identico. Se consideri la distribuzione che genera i dati $ D $, lo spazio delle caratteristiche è identico al supporto di $ D $.
- Direi che, come Pilon ' mostra che lo spazio delle funzionalità può essere aumentato estraendo alcune nuove funzionalità. Lo spazio campione in probabilità può ' t. È ' esaustivo, spazi per funzionalità aren ' t.
- @ Cam.Davidson.Pilon qualcuno è stato ispirato da la tua risposta sembra: dataorigami.net/blogs/napkin-folding/…
- @AIM_BLB che ' sono io!