Hvad er definitionen af “feature space”?
For eksempel, når jeg læser om SVMer, læser jeg om “mapping to feature plads”. Når jeg læser om CART, læser jeg om “partitionering til funktionsrum”.
Jeg forstår, hvad der foregår, især for CART, men jeg tror, at der er en definition, som jeg har savnet.
Er der en generel definition af “feature space”?
Er der en definition, der giver mig mere indblik i SVM-kerner og / eller CART?
Kommentarer
- Funktionsplads henviser kun til de samlinger af funktioner, der bruges til at karakterisere dine data. Hvis dine data f.eks. handler om mennesker, kan dit funktionsrum være (Køn, Højde, Vægt, alder). I en SVM vil vi måske overveje et andet sæt egenskaber for at beskrive dataene, såsom (køn, højde, vægt, alder ^ 2, højde / vægt) osv. Dette er kortlægningen til en anden funktion mellemrum
- Vil du venligst give navnene / titlerne på din læsning?
Svar
Feature Space
Feature space refererer til $ n $ -dimensionerne, hvor dine variabler lever (inkluderer ikke en målvariabel, hvis den er til stede). Udtrykket bruges ofte i ML-litteratur, fordi en opgave i ML er feature extraction , derfor ser vi alle variabler som funktioner. Overvej f.eks. Datasættet med:
Mål
- $ Y \ equiv $ Tykkelse af bildæk efter en eller anden testperiode
Variabler
- $ X_1 \ equiv $ tilbagelagt afstand i test
- $ X_2 \ equiv $ tidsvarighed af test
- $ X_3 \ equiv $ mængde kemikalie $ C $ i dæk
Funktionsområdet er $ \ mathbf {R} ^ 3 $, eller mere præcist, den positive kvadrant i $ \ mathbf {R} ^ 3 $ som alle de $ X $ variabler kan kun være positive størrelser. Domæne viden om dæk kan antyde, at den hastighed køretøjet kørte på er vigtig, derfor genererer vi en anden variabel, $ X_4 $ (dette er funktionen til udtrækning af funktioner):
- $ X_4 = \ frac {X_1} {X_2} \ svarer til køretøjets hastighed under test.
Dette udvider vores gamle funktionsrum til et nyt, den positive del af $ \ mathbf {R} ^ 4 $.
Kortlægninger
Desuden er en kortlægning i vores eksempel en funktion, $ \ phi $, fra $ \ mathbf {R} ^ 3 $ til $ \ mathbf {R} ^ 4 $:
$$ \ phi (x_1, x_2, x_3) = (x_1, x_2, x_3, \ frac {x_1} {x_2}) $$
Kommentarer
- Hvordan adskiller dette sig fra et eksempelrum i sandsynlighedsteorien? Spørger bare. Jeg vil gerne vide det.
- Det ' s er meget ens, hvis ikke identisk. Hvis du overvejer den datagenererende distribution $ D $, så er funktionsområdet identisk med understøttelsen af $ D $.
- Jeg vil sige det, da Pilon ' s eksempel viser, kan plads til funktioner øges ved at udpakke nogle nye funktioner. Prøveplads med sandsynlighed kan ' t. Det ' s udtømmende, funktionelle rum er ikke ' t.
- @ Cam.Davidson.Pilon nogen wsa inspireret af dit svar ser ud til: dataorigami.net/blogs/napkin-folding/…
- @AIM_BLB at ' er mig!