Care este definiția „spațiului caracteristicii”?

De exemplu, când citesc despre SVM-uri, am citit despre „maparea la caracteristică spaţiu”. Când citesc despre CART, am citit despre „partiționarea în spațiul caracteristic”.

Înțeleg ce se întâmplă, în special pentru CART, dar cred că există o definiție pe care am ratat-o.

Există o definiție generală a „spațiului de caracteristici”?

Există o definiție care să-mi ofere mai multe informații despre nucleele SVM și / sau CART?

Comentarii

  • Spațiul pentru funcții se referă doar la colecțiile de caracteristici care sunt utilizate pentru a vă caracteriza datele. De exemplu, dacă datele dvs. sunt despre oameni, spațiul pentru funcții ar putea fi (Sex, Înălțime, Greutate, vârstă). Într-un SVM, am putea dori să luăm în considerare un set diferit de caracteristici pentru a descrie datele, cum ar fi (sex, înălțime, greutate, vârstă ^ 2, înălțime / greutate) etc; aceasta este maparea către o altă caracteristică spațiu
  • Vă rog să dați numele / titlurile pe care le citiți?

Răspuns

Spațiul de funcții

Spațiul de funcții se referă la dimensiunile $ n $ -în care trăiesc variabilele dvs. (fără a include o variabilă țintă, dacă este prezentă). Termenul este folosit adesea în literatura ML, deoarece o sarcină în ML este extragerea caracteristicilor , prin urmare vedem toate variabilele ca caracteristici. De exemplu, luați în considerare setul de date cu:

Țintă

  1. $ Y \ equiv $ Grosimea anvelopelor auto după o anumită perioadă de testare

Variabile

  1. $ X_1 \ echiv $ distanță parcursă la test
  2. $ X_2 \ echiv $ durata duratei testului
  3. $ X_3 \ echiv $ cantitate de substanță chimică $ C $ în anvelope

Spațiul caracteristicii este $ \ mathbf {R} ^ 3 $, sau mai exact, cadranul pozitiv din $ \ mathbf {R} ^ 3 $ ca toate Variabilele $ X $ pot fi doar cantități pozitive. Cunoașterea domeniului despre anvelope ar putea sugera că viteza la care se deplasa vehiculul este importantă, de aceea generăm o altă variabilă, $ X_4 $ (aceasta este partea de extragere a caracteristicilor):

  • $ X_4 = \ frac {X_1} {X_2} \ echiv $ viteza vehiculului în timpul testării.

Aceasta extinde vechiul nostru spațiu caracteristic într-unul nou, partea pozitivă a $ \ mathbf {R} ^ 4 $.

Mappings

Mai mult, o mapare în exemplul nostru este o funcție, $ \ phi $, de la $ \ mathbf {R} ^ 3 $ la $ \ mathbf {R} ^ 4 $:

$$ \ phi (x_1, x_2, x_3) = (x_1, x_2, x_3, \ frac {x_1} {x_2}) $$

Comentarii

  • Cum diferă acest lucru de un spațiu eșantion în teoria probabilităților? Doar intrebam. Aș vrea să știu.
  • Este ' s este foarte asemănător, dacă nu identic. Dacă luați în considerare distribuția generatoare de date $ D $, atunci spațiul caracteristic este identic cu suportul lui $ D $.
  • Aș spune asta, ca Pilon ' arată, spațiul caracteristicilor poate fi mărit prin extragerea unor caracteristici noi. Probabilitatea spațiului de probă poate ' t. Este ' complet, spațiile caracteristice nu sunt ' t.
  • @ Cam.Davidson.Pilon cineva a fost inspirat de răspunsul dvs. pare: dataorigami.net/blogs/napkin-folding/…
  • @AIM_BLB care ' sunt eu!

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *