Was ist die Definition von „Feature Space“?

Wenn ich beispielsweise über SVMs lese, lese ich über „Zuordnung zu Feature“ Raum“. Wenn ich über CART lese, lese ich über „Partitionierung in Funktionsbereich“.

Ich verstehe, was „vor allem für CART“ vor sich geht, aber ich denke, dass es eine Definition gibt, die ich übersehen habe.

Gibt es eine allgemeine Definition von „Feature Space“?

Gibt es eine Definition, die mir mehr Einblick in SVM-Kernel und / oder CART gibt?

Kommentare

  • Der Funktionsbereich bezieht sich nur auf die Sammlung von Funktionen, die zur Charakterisierung Ihrer Daten verwendet werden. Wenn es sich bei Ihren Daten beispielsweise um Personen handelt, kann Ihr Funktionsbereich (Geschlecht, Größe, Gewicht, Alter) In einer SVM möchten wir möglicherweise einen anderen Satz von Merkmalen berücksichtigen, um die Daten zu beschreiben, wie z. B. (Geschlecht, Größe, Gewicht, Alter ^ 2, Größe / Gewicht) usw .; Dies ist die Zuordnung zu einem anderen Merkmal Leerzeichen
  • Geben Sie bitte die Namen / Titel Ihrer Lesung an.

Antwort

Feature Space

Der Feature Space bezieht sich auf die $ n $ -Dimensionen, in denen Ihre Variablen leben (ohne Zielvariable, falls vorhanden). Der Begriff wird in der ML-Literatur häufig verwendet, da eine Aufgabe in ML die Merkmalsextraktion ist. Daher betrachten wir alle Variablen als Merkmale. Betrachten Sie beispielsweise den Datensatz mit:

Ziel

  1. $ Y \ equiv $ Dicke der Autoreifen nach einer gewissen Testperiode

Variablen

  1. $ X_1 \ äquiv $ zurückgelegte Strecke im Test
  2. $ X_2 \ äquiv $ Zeitdauer des Tests
  3. $ X_3 \ äquiv $ Menge an Chemikalie $ C $ in Reifen

Der Merkmalsraum ist $ \ mathbf {R} ^ 3 $ oder genauer gesagt der positive Quadrant in $ \ mathbf {R} ^ 3 $ wie alle $ X $ -Variablen können nur positive Größen sein. Domänenkenntnisse über Reifen könnten darauf hindeuten, dass die Geschwindigkeit , mit der sich das Fahrzeug bewegte, wichtig ist. Daher generieren wir eine weitere Variable, $ X_4 $ (dies ist der Teil zur Merkmalsextraktion):

  • $ X_4 = \ frac {X_1} {X_2} \ äquiv $ die Geschwindigkeit des Fahrzeugs während des Testens.

Dies erweitert unseren alten Funktionsbereich in einen neuen, den positiven Teil von $ \ mathbf {R} ^ 4 $.

Zuordnungen

Außerdem ist eine Zuordnung in unserem Beispiel eine Funktion $ \ phi $ von $ \ mathbf {R} ^ 3 $ bis $ \ mathbf {R} ^ 4 $:

$$ \ phi (x_1, x_2, x_3) = (x_1, x_2, x_3, \ frac {x_1} {x_2}) $$

Kommentare

  • Wie unterscheidet sich dies von einem Stichprobenraum in der Wahrscheinlichkeitstheorie? Nur Fragen. Ich würde gerne wissen.
  • Es ' ist sehr ähnlich, wenn nicht identisch. Wenn Sie die datengenerierende Verteilung $ D $ betrachten, ist der Feature-Space identisch mit der Unterstützung von $ D $.
  • Ich würde das als Pilon ' zeigt, dass der Funktionsbereich durch Extrahieren einiger neuer Funktionen vergrößert werden kann. Der Probenraum in der Wahrscheinlichkeit kann ' t. ' ist erschöpfend, Feature-Spaces sind nicht ' t.
  • @ Cam.Davidson.Pilon jemand, von dem jemand inspiriert wurde Ihre Antwort scheint: dataorigami.net/blogs/napkin-folding/…
  • @AIM_BLB das ' ich bin!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.