Ik “heb problemen met het begrijpen van het gebruik van Vector in machine learning om een groep functies weer te geven.
Als men de definitie van een vector, dan is een vector volgens Wikipedia een entiteit met een grootte en richting.
Dit kan worden begrepen wanneer vectoren worden toegepast op bijvoorbeeld fysica om kracht, snelheid, versnelling, enz. ..: de componenten van de vector vertegenwoordigen de componenten van de fysische eigenschap langs de assen in de ruimte. De componenten van een snelheidsvector vertegenwoordigen bijvoorbeeld de snelheid langs de x-, y- en z-assen
wanneer vectoren op machine learning worden toegepast om kenmerken weer te geven, kunnen die kenmerken totaal niet-gerelateerde entiteiten zijn. Ze kunnen totaal verschillende eenheden hebben: een kenmerk kan de lengte in meters van een persoon zijn en een ander kan de leeftijd in jaren van de persoon zijn. / p>
Maar wat is dan de betekenis van de Magnitude van zon Vector, die dan gevormd zou worden door een optelling van m eters en jaren? En de richting?
Ik weet wat het normaliseren van functies is om ze vergelijkbare bereiken te geven, maar mijn vraag is fundamenteler.
Antwoord
Ik “heb problemen met het begrijpen van het gebruik van Vector in machine learning om een groep functies weer te geven.
Kortom , ik zou zeggen dat” Features Vector “slechts een handige manier is om over een reeks functies te spreken.
Inderdaad, voor elk label “y “(te voorspellen), je hebt een reeks waarden” X “nodig. En een erg handige manier om dit weer te geven, is door de waarden in een vector te plaatsen, zodat als je meerdere labels bekijkt, je een matrix krijgt met één rij per label en één kolom per object.
Op een abstracte manier kun je zeker denken aan die vectoren die tot een ruimte met meerdere dimensies behoren, maar (meestal) geen n Euclidische. Daarom is alle wiskunde van toepassing, alleen de interpretatie is anders!
Hoop dat het je helpt.
Reacties
- Dat is wat voor soort van verwarring me: " niet een Euclidische ". Als het geen Euclidisch is, wat voor soort is het dan? Vandaar de titel: " Wat voor soort vector is … " Of ben ik te specifiek in het interpreteren van " Euclidisch "?
- De vectorweergave vereenvoudigt alleen de verwerking en statistische analyse. Als je op zoek bent naar een interpretatie, is dit geen technische vraag meer en ik denk dat je gewoon op een meer abstracte manier moet denken, alsof je jezelf probeert voor te stellen wat een n-dimensionale Euclidische ruimte is. (n > 3)
Antwoord
Laten we eerst praten over hoe u uw gegevens organiseert. Laten we aannemen dat u uw gegevens in een spreadsheet organiseert, waarin kolommen uw kenmerken vertegenwoordigen en uw verschillende voorbeelden in rijen staan. Stel je voor dat je 3 mensen vraagt naar hun geslacht en leeftijd, dan krijg je een spreadsheet met 3 rijen (3 personen) en 2 kolommen (geslacht, leeftijd).
Nu kunt u elke rij interpreteren als een enkele feature-vector. In ons voorbeeldgeval zou de kenmerkvector twee dimensies hebben (geslacht, leeftijd). In plaats van fysica heeft de (euclid.) Grootte van de kenmerkvector voor ons misschien geen direct nut, aangezien de dimensies uit verschillende domeinen komen (in tegenstelling tot een snelheidsvector). Desalniettemin konden we de grootte berekenen (na normalisatie). Aan de andere kant is de richting van de kenmerkvector belangrijk, aangezien deze de kenmerkwaarden zelf vertegenwoordigt.
Al met al zouden kenmerkvectoren niet direct geïnterpreteerd moeten worden zoals je in de natuurkunde doet.
Answer
Vectoren hebben perspectief vanuit het standpunt van wiskunde, natuurkunde en informatica.
Ik raad je aan om Grant Sandersons video over vectoren op zijn kanaal 3BLUE1BROWN of liever doorloop zijn hele serie op ESSENCE OF LINEAR ALGEBRA , voor een beter visueel begrip van lineaire algebra .
Nu we het hebben over feature-vectoren , ze zijn niets anders dan een verzameling van alle features (individuele eigenschap of kenmerk van een fenomeen dat wordt waargenomen) op een specifieke manier gerangschikt. Het is een n-dimensionale vector van numerieke kenmerken die een object vertegenwoordigen dat vereist is voor de algoritmen voor machine learning. Bekijk deze Wikipedia artikel van waaruit ik heb geschreven over kenmerkvectoren.