Care este definiția „spațiului caracteristicii”?
De exemplu, când citesc despre SVM-uri, am citit despre „maparea la caracteristică spaţiu”. Când citesc despre CART, am citit despre „partiționarea în spațiul caracteristic”.
Înțeleg ce se întâmplă, în special pentru CART, dar cred că există o definiție pe care am ratat-o.
Există o definiție generală a „spațiului de caracteristici”?
Există o definiție care să-mi ofere mai multe informații despre nucleele SVM și / sau CART?
Comentarii
- Spațiul pentru funcții se referă doar la colecțiile de caracteristici care sunt utilizate pentru a vă caracteriza datele. De exemplu, dacă datele dvs. sunt despre oameni, spațiul pentru funcții ar putea fi (Sex, Înălțime, Greutate, vârstă). Într-un SVM, am putea dori să luăm în considerare un set diferit de caracteristici pentru a descrie datele, cum ar fi (sex, înălțime, greutate, vârstă ^ 2, înălțime / greutate) etc; aceasta este maparea către o altă caracteristică spațiu
- Vă rog să dați numele / titlurile pe care le citiți?
Răspuns
Spațiul de funcții
Spațiul de funcții se referă la dimensiunile $ n $ -în care trăiesc variabilele dvs. (fără a include o variabilă țintă, dacă este prezentă). Termenul este folosit adesea în literatura ML, deoarece o sarcină în ML este extragerea caracteristicilor , prin urmare vedem toate variabilele ca caracteristici. De exemplu, luați în considerare setul de date cu:
Țintă
- $ Y \ equiv $ Grosimea anvelopelor auto după o anumită perioadă de testare
Variabile
- $ X_1 \ echiv $ distanță parcursă la test
- $ X_2 \ echiv $ durata duratei testului
- $ X_3 \ echiv $ cantitate de substanță chimică $ C $ în anvelope
Spațiul caracteristicii este $ \ mathbf {R} ^ 3 $, sau mai exact, cadranul pozitiv din $ \ mathbf {R} ^ 3 $ ca toate Variabilele $ X $ pot fi doar cantități pozitive. Cunoașterea domeniului despre anvelope ar putea sugera că viteza la care se deplasa vehiculul este importantă, de aceea generăm o altă variabilă, $ X_4 $ (aceasta este partea de extragere a caracteristicilor):
- $ X_4 = \ frac {X_1} {X_2} \ echiv $ viteza vehiculului în timpul testării.
Aceasta extinde vechiul nostru spațiu caracteristic într-unul nou, partea pozitivă a $ \ mathbf {R} ^ 4 $.
Mappings
Mai mult, o mapare în exemplul nostru este o funcție, $ \ phi $, de la $ \ mathbf {R} ^ 3 $ la $ \ mathbf {R} ^ 4 $:
$$ \ phi (x_1, x_2, x_3) = (x_1, x_2, x_3, \ frac {x_1} {x_2}) $$
Comentarii
- Cum diferă acest lucru de un spațiu eșantion în teoria probabilităților? Doar intrebam. Aș vrea să știu.
- Este ' s este foarte asemănător, dacă nu identic. Dacă luați în considerare distribuția generatoare de date $ D $, atunci spațiul caracteristic este identic cu suportul lui $ D $.
- Aș spune asta, ca Pilon ' arată, spațiul caracteristicilor poate fi mărit prin extragerea unor caracteristici noi. Probabilitatea spațiului de probă poate ' t. Este ' complet, spațiile caracteristice nu sunt ' t.
- @ Cam.Davidson.Pilon cineva a fost inspirat de răspunsul dvs. pare: dataorigami.net/blogs/napkin-folding/…
- @AIM_BLB care ' sunt eu!