Mikä on ”ominaisuusalueen” määritelmä?
Esimerkiksi kun luin SVM: istä, luin ominaisuuden kartoittamisesta tila ”. Kun luin CARTista, luin ”osioinnista ominaisuusalueeseen”.
Ymmärrän, mitä tapahtuu, erityisesti CART: n kohdalla, mutta mielestäni on jokin määritelmä, jonka olen unohtanut.
Onko olemassa ”ominaisuusalueen” yleinen määritelmä?
Onko määritelmä, joka antaa minulle enemmän tietoa SVM-ytimistä ja / tai CARTista?
Kommentit
- Ominaisuusalue viittaa vain ominaisuuksien kokoelmiin, joita käytetään tietojen kuvaamiseen. Esimerkiksi, jos tietosi koskevat ihmisiä, ominaisuusalueesi voi olla (Sukupuoli, Korkeus, Paino, ikä). SVM: ssä saatamme haluta harkita erilaista ominaisuusjoukkoa kuvaamaan tietoja, kuten (Sukupuoli, Pituus, Paino, Ikä ^ 2, Korkeus / Paino) jne.; Tämä on kartoitus toiseen ominaisuuteen välilyönti
- Voisitko antaa lukemiesi nimet / otsikot?
Vastaa
Feature Space
Feature space viittaa muuttujien elämään $ n $ -mitoihin (ilman kohdemuuttujaa, jos se on läsnä). Termiä käytetään usein ML-kirjallisuudessa, koska ML: n tehtävä on ominaisuuksien poiminta , joten me katsomme kaikkia muuttujia ominaisuuksina. Harkitse esimerkiksi tietojoukkoa:
Kohde
- $ Y \ equiv $ Autorenkaiden paksuus jonkin testijakson jälkeen
Muuttujat
- $ X_1 \ equiv $ testissä kuljettu matka
- $ X_2 \ equiv $ testin kesto
- $ X_3 \ equiv $ määrä kemikaalia $ C $ renkaissa
Ominaisuusväli on $ \ mathbf {R} ^ 3 $ tai tarkemmin sanottuna positiivinen kvadrantti luvussa $ \ mathbf {R} ^ 3 $ kuin kaikki $ X $ -muuttujat voivat olla vain positiivisia määriä. Verkkotunnusten tuntemus renkaista saattaa viitata siihen, että nopeus , jolla ajoneuvo liikkui, on tärkeä, joten luomme toisen muuttujan, $ X_4 $ (tämä on ominaisuuden poimintaosa):
- $ X_4 = \ frac {X_1} {X_2} \ vastaa $ ajoneuvon nopeutta testauksen aikana.
Tämä laajentaa vanhan ominaisuusvarastomme uuteen, positiiviseen osaan $ \ mathbf {R} ^ 4 $.
Yhdistelmät
Lisäksi esimerkissämme kartoitus on funktio $ \ phi $, välillä $ \ mathbf {R} ^ 3 $ – $ \ mathbf {R} ^ 4 $:
$$ \ phi (x_1, x_2, x_3) = (x_1, x_2, x_3, \ frac {x_1} {x_2}) $$
Kommentit
- Miten tämä eroaa todennäköisyysteorian otosavaruudesta? Vain kysyä. Haluaisin tietää.
- Se ' on hyvin samanlainen, ellei identtinen. Jos otetaan huomioon dataa tuottava jakelu $ D $, ominaisuus-tila on identtinen dollarin $ $ tuen kanssa.
- Sanoisin, että Pilon ' s -esimerkki osoittaa, että ominaisuusaluetta voidaan lisätä poimimalla joitain uusia ominaisuuksia. Näytetila todennäköisyydessä voi ' t. Se ' on tyhjentävä, ominaisuusvälit eivät ole ' t.
- @ Cam.Davidson.Pilon joku wsa innoittamana vastauksesi näyttää siltä: dataorigami.net/blogs/napkin-folding/…
- @AIM_BLB että ' on minulle!