Hva er definisjonen av «feature space»?

For eksempel, når jeg leser om SVM, leser jeg om «mapping to feature rom». Når jeg leser om CART, leste jeg om «partisjonering til funksjonsrom».

Jeg forstår hva som skjer, spesielt for CART, men jeg tror at det er noen definisjon jeg har savnet.

Er det en generell definisjon av «funksjonsrom»?

Er det en definisjon som vil gi meg mer innsikt i SVM-kjerner og / eller CART?

Kommentarer

  • Feature space refererer bare til samlingene av funksjoner som brukes til å karakterisere dataene dine. For eksempel, hvis dataene dine handler om mennesker, kan funksjonsområdet være (Kjønn, Høyde, Vekt, alder). I en SVM vil vi kanskje vurdere et annet sett med egenskaper for å beskrive dataene, for eksempel (kjønn, høyde, vekt, alder ^ 2, høyde / vekt) osv. Dette er kartleggingen til en annen funksjon mellomrom
  • Vil du oppgi navnene / titlene du leser?

Svar

Feature Space

Feature space refererer til $ n $ -dimensjonene der variablene dine bor (ikke inkludert en målvariabel, hvis den er til stede). Begrepet brukes ofte i ML-litteratur fordi en oppgave i ML er funksjonsutvinning , derfor ser vi alle variablene som funksjoner. Tenk for eksempel datasettet med:

Mål

  1. $ Y \ equiv $ Tykkelse på bildekk etter en eller annen testperiode

Variabler

  1. $ X_1 \ equiv $ avstand i test
  2. $ X_2 \ equiv $ testtid
  3. $ X_3 \ equiv $ mengde kjemikalie $ C $ i dekk

Funksjonsområdet er $ \ mathbf {R} ^ 3 $, eller mer nøyaktig, den positive kvadranten i $ \ mathbf {R} ^ 3 $ som alle $ X $ variabler kan bare være positive mengder. Domenekunnskap om dekk kan tyde på at hastigheten kjøretøyet kjørte på er viktig, derfor genererer vi en annen variabel, $ X_4 $ (dette er delen for funksjonsutvinning):

  • $ X_4 = \ frac {X_1} {X_2} \ tilsvarer kjøretøyets hastighet under testing.

Dette utvider vårt gamle funksjonsrom til en ny, den positive delen av $ \ mathbf {R} ^ 4 $.

Kartlegginger

Videre er en mapping i vårt eksempel en funksjon, $ \ phi $, fra $ \ mathbf {R} ^ 3 $ til $ \ mathbf {R} ^ 4 $:

$$ \ phi (x_1, x_2, x_3) = (x_1, x_2, x_3, \ frac {x_1} {x_2}) $$

Kommentarer

  • Hvordan skiller dette seg fra et eksemplarom i sannsynlighetsteorien? Bare spør. Jeg vil gjerne vite det.
  • Det ' s er veldig likt, om ikke identisk. Hvis du vurderer den datagenererende distribusjonen $ D $, er funksjonsrommet identisk med støtten til $ D $.
  • Jeg vil si det, som Pilon ' s eksempel viser, kan funksjonsområdet økes ved å trekke ut noen nye funksjoner. Eksempelplass i sannsynlighet kan ' t. Det ' s uttømmende, funksjonelle rom er ikke ' t.
  • @ Cam.Davidson.Pilon noen som er inspirert av svaret ditt ser ut til: dataorigami.net/blogs/napkin-folding/…
  • @AIM_BLB at ' er meg!

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *