Ich habe Probleme, die Verwendung von Vector beim maschinellen Lernen zur Darstellung einer Gruppe von Funktionen zu verstehen.
Wenn Sie die nachschlagen Definition eines Vektors, dann ist laut Wikipedia ein Vektor eine Entität mit einer Größe und Richtung.
Dies kann verstanden werden, wenn Vektoren beispielsweise auf die Physik angewendet werden, um Kraft, Geschwindigkeit, Beschleunigung usw. darzustellen. ..: Die Komponenten des Vektors repräsentieren die Komponenten der physikalischen Eigenschaft entlang der Achsen im Raum. Beispielsweise repräsentieren die Komponenten eines Geschwindigkeitsvektors die Geschwindigkeit entlang der x-, y- und z-Achse.
Wenn Sie Vektoren auf maschinelles Lernen anwenden, um Merkmale darzustellen, können diese Merkmale völlig unabhängige Einheiten sein. Sie können völlig unterschiedliche Einheiten haben: Ein Merkmal kann die Länge in Metern einer Person und ein anderes das Alter in Jahren der Person sein.
Aber was bedeutet dann die Größe eines solchen Vektors, der dann durch eine Summe von m gebildet würde? eters und Jahre? Und die Richtung?
Ich weiß, wie Features normalisiert werden, damit sie ähnliche Bereiche haben, aber meine Frage ist grundlegender.
Antwort
Ich habe Probleme, die Verwendung von Vector beim maschinellen Lernen zur Darstellung einer Gruppe von Funktionen zu verstehen.
Kurz würde ich sagen, dass“ Features Vector „nur ein bequemer Weg ist um über eine Reihe von Funktionen zu sprechen.
In der Tat für jedes Label „y „(vorherzusagen), Sie benötigen eine Reihe von Werten“ X „. Eine sehr bequeme Möglichkeit, dies darzustellen, besteht darin, die Werte in einen Vektor einzufügen, sodass Sie bei Betrachtung mehrerer Beschriftungen eine Matrix erhalten, die Folgendes enthält Eine Zeile pro Beschriftung und eine Spalte pro Feature.
Auf abstrakte Weise können Sie sich definitiv die Vektoren vorstellen, die zu einem Raum mit mehreren Dimensionen gehören, aber (normalerweise) nicht a n Euklidischer. Daher gilt die gesamte Mathematik, nur die Interpretation unterscheidet sich!
Ich hoffe, das hilft Ihnen.
Kommentare
- Das ist die Art von verwirrt mich: " kein euklidischer ". Wenn es kein Euklid ist, welche Art ist es dann? Daher der Titel: " Was für ein Vektor ist … " Oder bin ich bei der Interpretation von Euklidisch "?
- Die Vektordarstellung erleichtert lediglich die Verarbeitung und statistische Analyse. Wenn Sie nach einer Interpretation suchen, ist dies keine technische Frage mehr, und ich denke, Sie müssen nur abstrakter denken, als ob Sie versuchen, sich selbst darzustellen, was ein n-dimensionaler euklidischer Raum ist. (n > 3)
Antwort
Lassen Sie uns zuerst sprechen Nehmen wir an, Sie organisieren Ihre Daten in einer Tabelle, in der Spalten Ihre Features und Zeilen Ihre verschiedenen Beispiele darstellen. Stellen Sie sich vor, Sie haben 3 Personen nach Geschlecht und Alter gefragt und erhalten dann eine Tabelle mit 3 Zeilen (3 Personen) und 2 Spalten (Geschlecht, Alter).
Jetzt können Sie jede Zeile als einen einzelnen Merkmalsvektor interpretieren. In unserem Beispielfall hätte der Merkmalsvektor zwei Dimensionen (Geschlecht, Alter). Anstelle der Physik könnte die (euklidische) Größe des Merkmalsvektors für uns keine direkte Verwendung haben, da die Dimensionen aus verschiedenen Bereichen stammen (vergleiche im Gegensatz dazu einen Geschwindigkeitsvektor). Trotzdem konnten wir die Größe (nach Normalisierung) berechnen. Andererseits ist die Richtung des Merkmalsvektors wichtig, da er die Merkmalswerte selbst darstellt.
Insgesamt sollten Merkmalsvektoren nicht direkt wie in der Physik interpretiert werden.
Antwort
Vektoren haben eine Perspektive aus Sicht der Mathematik, Physik und Informatik.
Ich schlage vor, dass Sie das Video von Grant Sanderson auf Vektoren auf seinem Kanal 3BLUE1BROWN oder besser gesagt seine gesamte Serie auf ESSENCE OF LINEAR ALGEBRA für ein besseres visuelles Verständnis der linearen Algebra
Wenn Sie über Merkmalsvektoren sprechen, handelt es sich lediglich um eine Sammlung aller Merkmale (Eigenschaft Individualial) oder charakteristisch für ein beobachtetes Phänomen), das auf eine bestimmte Weise angeordnet ist. Es ist ein n-dimensionaler Vektor numerischer Merkmale, die ein Objekt darstellen, das von den Algorithmen für maschinelles Lernen benötigt wird. Gehen Sie einfach diese Wikipedia durch Artikel , aus dem ich über Feature-Vektoren geschrieben habe.