Mikä on ”ominaisuusalueen” määritelmä?

Esimerkiksi kun luin SVM: istä, luin ominaisuuden kartoittamisesta tila ”. Kun luin CARTista, luin ”osioinnista ominaisuusalueeseen”.

Ymmärrän, mitä tapahtuu, erityisesti CART: n kohdalla, mutta mielestäni on jokin määritelmä, jonka olen unohtanut.

Onko olemassa ”ominaisuusalueen” yleinen määritelmä?

Onko määritelmä, joka antaa minulle enemmän tietoa SVM-ytimistä ja / tai CARTista?

Kommentit

  • Ominaisuusalue viittaa vain ominaisuuksien kokoelmiin, joita käytetään tietojen kuvaamiseen. Esimerkiksi, jos tietosi koskevat ihmisiä, ominaisuusalueesi voi olla (Sukupuoli, Korkeus, Paino, ikä). SVM: ssä saatamme haluta harkita erilaista ominaisuusjoukkoa kuvaamaan tietoja, kuten (Sukupuoli, Pituus, Paino, Ikä ^ 2, Korkeus / Paino) jne.; Tämä on kartoitus toiseen ominaisuuteen välilyönti
  • Voisitko antaa lukemiesi nimet / otsikot?

Vastaa

Feature Space

Feature space viittaa muuttujien elämään $ n $ -mitoihin (ilman kohdemuuttujaa, jos se on läsnä). Termiä käytetään usein ML-kirjallisuudessa, koska ML: n tehtävä on ominaisuuksien poiminta , joten me katsomme kaikkia muuttujia ominaisuuksina. Harkitse esimerkiksi tietojoukkoa:

Kohde

  1. $ Y \ equiv $ Autorenkaiden paksuus jonkin testijakson jälkeen

Muuttujat

  1. $ X_1 \ equiv $ testissä kuljettu matka
  2. $ X_2 \ equiv $ testin kesto
  3. $ X_3 \ equiv $ määrä kemikaalia $ C $ renkaissa

Ominaisuusväli on $ \ mathbf {R} ^ 3 $ tai tarkemmin sanottuna positiivinen kvadrantti luvussa $ \ mathbf {R} ^ 3 $ kuin kaikki $ X $ -muuttujat voivat olla vain positiivisia määriä. Verkkotunnusten tuntemus renkaista saattaa viitata siihen, että nopeus , jolla ajoneuvo liikkui, on tärkeä, joten luomme toisen muuttujan, $ X_4 $ (tämä on ominaisuuden poimintaosa):

  • $ X_4 = \ frac {X_1} {X_2} \ vastaa $ ajoneuvon nopeutta testauksen aikana.

Tämä laajentaa vanhan ominaisuusvarastomme uuteen, positiiviseen osaan $ \ mathbf {R} ^ 4 $.

Yhdistelmät

Lisäksi esimerkissämme kartoitus on funktio $ \ phi $, välillä $ \ mathbf {R} ^ 3 $ – $ \ mathbf {R} ^ 4 $:

$$ \ phi (x_1, x_2, x_3) = (x_1, x_2, x_3, \ frac {x_1} {x_2}) $$

Kommentit

  • Miten tämä eroaa todennäköisyysteorian otosavaruudesta? Vain kysyä. Haluaisin tietää.
  • Se ' on hyvin samanlainen, ellei identtinen. Jos otetaan huomioon dataa tuottava jakelu $ D $, ominaisuus-tila on identtinen dollarin $ $ tuen kanssa.
  • Sanoisin, että Pilon ' s -esimerkki osoittaa, että ominaisuusaluetta voidaan lisätä poimimalla joitain uusia ominaisuuksia. Näytetila todennäköisyydessä voi ' t. Se ' on tyhjentävä, ominaisuusvälit eivät ole ' t.
  • @ Cam.Davidson.Pilon joku wsa innoittamana vastauksesi näyttää siltä: dataorigami.net/blogs/napkin-folding/…
  • @AIM_BLB että ' on minulle!

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *