Wat is de definitie van “feature space”?

Als ik bijvoorbeeld over SVMs lees, lees ik over “mapping to feature ruimte”. Toen ik over CART las, las ik over “partitioneren naar feature space”.

Ik begrijp wat er aan de hand is, vooral voor CART, maar ik denk dat er een definitie is die ik heb gemist.

Is er een algemene definitie van “feature space”?

Is er een definitie die me meer inzicht geeft in SVM-kernels en / of CART?

Opmerkingen

  • Functieruimte verwijst alleen naar de verzamelingen elementen die worden gebruikt om uw gegevens te karakteriseren. Als uw gegevens bijvoorbeeld over mensen gaan, kan uw functieruimte (geslacht, lengte, Gewicht, leeftijd). In een SVM willen we misschien een andere set kenmerken overwegen om de gegevens te beschrijven, zoals (geslacht, lengte, gewicht, leeftijd ^ 2, lengte / gewicht) enz. Dit is de toewijzing aan een ander kenmerk spatie
  • Zou je de namen / titels van je lezing willen noemen?

Antwoord

Feature Space

Feature Space verwijst naar de $ n $ -dimensies waarin je variabelen leven (zonder een doelvariabele, indien aanwezig). De term wordt vaak gebruikt in ML-literatuur omdat een taak in ML feature-extractie is, daarom zien we alle variabelen als features. Beschouw bijvoorbeeld de dataset met:

Target

  1. $ Y \ equiv $ Dikte van autobanden na enige testperiode

Variabelen

  1. $ X_1 \ equiv $ afgelegde afstand in test
  2. $ X_2 \ equiv $ tijdsduur van de test
  3. $ X_3 \ equiv $ hoeveelheid chemische stof $ C $ in banden

De feature-ruimte is $ \ mathbf {R} ^ 3 $, of beter gezegd, het positieve kwadrant in $ \ mathbf {R} ^ 3 $ als alle $ X $ -variabelen kunnen alleen positieve hoeveelheden zijn. Domeinkennis over banden zou kunnen suggereren dat de snelheid waarmee het voertuig reed belangrijk is, daarom genereren we een andere variabele, $ X_4 $ (dit is het onderdeel voor het extraheren van functies):

  • $ X_4 = \ frac {X_1} {X_2} \ equiv $ de snelheid van het voertuig tijdens het testen.

Dit breidt onze oude functieruimte uit naar een nieuwe, het positieve deel van $ \ mathbf {R} ^ 4 $.

Mappings

Verder is een mapping in ons voorbeeld een functie, $ \ phi $, van $ \ mathbf {R} ^ 3 $ naar $ \ mathbf {R} ^ 4 $:

$$ \ phi (x_1, x_2, x_3) = (x_1, x_2, x_3, \ frac {x_1} {x_2}) $$

Opmerkingen

  • Hoe verschilt dit van een steekproefruimte in de kansrekening? Ik vraag het maar. Ik zou het graag willen weten.
  • Het ' s lijkt erg op elkaar, zo niet identiek. Als je kijkt naar de gegevensgenererende distributie $ D $, dan is de feature-space identiek aan de ondersteuning van $ D $.
  • Dat zou ik zeggen, zoals Pilon ' s voorbeeldshows, kan de feature-ruimte worden vergroot door een aantal nieuwe features te extraheren. Sample ruimte in waarschijnlijkheid kan ' t. Het ' s uitputtend, feature spaties zijn ' t.
  • @ Cam.Davidson.Pilon iemand wsa geïnspireerd door uw antwoord lijkt: dataorigami.net/blogs/napkin-folding/…
  • @AIM_BLB dat ' mij is!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *