Ich habe gelernt, dass ein Merkmal eine individuell messbare Eigenschaft eines beobachteten Phänomens ist.
Sagen wir zum Beispiel, ich vertrete einen Menschen.
Dann können verschiedene Merkmale Alter, Gewicht, Größe usw. sein. Wenn ich diese Merkmale nun in einen Vektor platziere, wird ein Merkmalsvektor gebildet. Nach dem, was ich habe, wird der Merkmalsvektor (ein Array) in diesem Fall drei Elemente haben: Das erste ist das Alter, dann das Gewicht und schließlich die Größe. In ähnlicher Weise hätte ich für „n“ Individuen „n“ Merkmalsvektoren mit jeweils 3 Elementen.
Was ist in diesem Zusammenhang ein Feature-Set?
Antwort
Ein Feature-Vektor ist ein Vektor, der speichert die Merkmale für eine bestimmte Beobachtung in einer bestimmten Reihenfolge.
Zum Beispiel ist Alice 26 Jahre alt und 5 „6“ groß. Ihr Merkmalsvektor kann [26, 5.5] oder [5.5, 26] sein, je nachdem, wie Sie die Elemente bestellen. Die Reihenfolge ist nur insofern wichtig, als sie konsistent ist.
Ein Funktionssatz ist ein Satz aller Attribute, an denen Sie interessiert sind, z. B. Größe und Alter. P. >
Die implizite Annahme bei Verwendung dieser Terminologie ist, dass Ihre Daten tabellarisch sind – irgendwie haben Sie sich dafür entschieden, sie als „flaches“, matrixartiges Format darzustellen. Aber nicht tabellarische Daten Formate wie Netzwerkgraphen, Video, Audio, Bilder, binäre Datensequenzen usw. erfordern ein gewisses Maß an Engineering, um sie als Merkmalsvektoren darzustellen.
Antwort
Feature: ist eine Liste von Zahlen, z. B.: Alter, Name, Größe, Gewicht usw. Dies bedeutet, dass jede Spalte ein Merkmal in der relationalen Tabelle ist.
Merkmalsvektor ist eine Darstellung eines bestimmten Merkmals Zeile in relationaler Tabelle. Jede Zeile ist ein Merkmalsvektor, Zeile „n“ ist ein Merkmalsvektor für das „n“ -te Beispiel.
Featur e Set: Hilfe bei der Vorhersage der Ausgabevariablen.
Beispiel: Um das Alter einer bestimmten Person vorherzusagen, müssen wir das Geburtsjahr kennen. Hier Feature-Set = Geburtsjahr.
Normalerweise kann ein guter Feature-Set anhand von Expertenwissen oder mathematischem Ansatz identifiziert werden.
Antwort
Aus Sicht einer einfachen Datenstruktur besteht der Unterschied darin, dass eine Menge keine inhärente Reihenfolge hat und keine Duplikate enthält (vgl. einen Beutel mit Lotteriekugeln), während ein Vektor eine Reihenfolge hat und einen beliebigen Wert enthalten kann (ähnlich einem Array) oder eindimensionale Matrix).