Jai du mal à comprendre lutilisation de Vector en machine learning pour représenter un groupe de fonctionnalités.
Si lon recherche le définition dun vecteur, alors, selon wikipedia, un vecteur est une entité avec une magnitude et une direction.
Ceci peut être compris en appliquant des vecteurs à, par exemple, la physique pour représenter la force, la vitesse, laccélération, etc. ..: les composantes du vecteur représentent les composantes de la propriété physique le long des axes dans lespace. Par exemple, les composantes dun vecteur vitesse représentent la vitesse le long des axes x, y et z
Cependant, lors de lapplication de vecteurs à lapprentissage automatique pour représenter des entités, ces entités peuvent être des entités totalement indépendantes. Elles peuvent avoir des unités totalement différentes: une caractéristique peut être la longueur en mètres dune personne et une autre peut être lâge en années de la personne.
Mais alors quelle est la signification de la magnitude dun tel vecteur, qui serait alors formée par une sommation de m eters et années? Et la direction?
Je connais la normalisation des fonctionnalités pour leur donner des plages similaires, mais ma question est plus fondamentale.
Réponse
Jai du mal à comprendre lutilisation de Vector dans lapprentissage automatique pour représenter un groupe de fonctionnalités.
En bref , je dirais que » Features Vector « est juste un moyen pratique pour parler dun ensemble de fonctionnalités.
En effet, pour chaque libellé « y « (à prévoir), vous avez besoin dun ensemble de valeurs » X « . Et une façon très pratique de représenter cela est de placer les valeurs dans un vecteur, de sorte que lorsque vous considérez plusieurs étiquettes, vous vous retrouvez avec une matrice contenant une ligne par étiquette et une colonne par entité.
De manière abstraite, vous pouvez certainement penser à ces vecteurs appartenant à un espace à dimensions multiples, mais (généralement) pas un n Euclidienne. Par conséquent, tous les calculs sappliquent, seule linterprétation diffère!
Jespère que cela vous aidera.
Commentaires
- Voilà de quoi il sagit de me confond: " pas un euclidien ". Si ce nest pas euclidien, de quel genre sagit-il? Doù le titre: " Quel genre de vecteur est …. " Ou suis-je trop précis dans linterprétation de " Euclidienne "?
- La représentation vectorielle facilite simplement le traitement et lanalyse statistique. Si vous cherchez une interprétation, ce nest plus une question technique et je pense que vous avez juste besoin de penser dune manière plus abstraite, comme si vous essayiez de vous représenter ce quest un espace euclidien à n dimensions. (n > 3)
Réponse
Parlons dabord Supposons que vous organisez vos données dans une feuille de calcul, où les colonnes représentent vos entités et les lignes vos différents échantillons. Imaginez que vous interrogiez 3 personnes sur leur sexe et leur âge, puis vous obtenez une feuille de calcul avec 3 lignes (3 personnes) et 2 colonnes (sexe, âge).
Vous pouvez désormais interpréter chaque ligne comme un seul vecteur de caractéristiques. Dans notre exemple, le vecteur de caractéristiques aurait 2 dimensions (sexe, âge). Au lieu de la physique, la magnitude (euclide) du vecteur de caractéristiques pourrait ne pas avoir dutilisation directe pour nous, puisque les dimensions proviennent de domaines différents (comparez au contraire un vecteur de vitesse). Néanmoins, nous avons pu calculer la grandeur (après normalisation). Dun autre côté, la direction du vecteur de caractéristiques est importante, car elle représente les valeurs de caractéristiques elles-mêmes.
Dans lensemble, les vecteurs de caractéristiques ne doivent pas être directement interprétés comme vous le faites en physique.
Réponse
Les vecteurs ont une perspective du point de vue des mathématiques, de la physique et de linformatique.
Je vous suggère de visionner la vidéo de Grant Sanderson « s sur des vecteurs sur sa chaîne 3BLUE1BROWN ou plutôt parcourir toute sa série sur ESSENCE OF LINEAR ALGEBRA , pour une meilleure compréhension visuelle de lalgèbre linéaire .
En parlant de vecteurs de caractéristiques , ils ne sont rien dautre quune collection de toutes les caractéristiques (propriété individuelle ou caractéristique dun phénomène observé) arrangé dune manière spécifique. Cest un vecteur à n dimensions de caractéristiques numériques qui représentent un objet requis par les algorithmes dapprentissage automatique. Il suffit de parcourir ce Wikipedia article doù jai écrit sur les vecteurs de caractéristiques.