Jag har problem med att förstå användningen av Vector för maskininlärning för att representera en grupp funktioner.

Om man letar upp definition av en vektor, enligt wikipedia är en vektor en enhet med en storlek och riktning.

Detta kan förstås när man tillämpar vektorer till exempel fysik för att representera kraft, hastighet, acceleration etc. ..: komponenterna i vektorn representerar komponenterna i den fysiska egenskapen längs axlarna i rymden. Exempelvis representerar komponenterna i en hastighetsvektor hastigheten längs x-, y- och z-axlarna

Emellertid, när vektorer tillämpas på maskininlärning för att representera funktioner, då kan dessa funktioner vara helt orelaterade enheter. De kan ha helt olika enheter: en funktion kan vara längden i meter för en person och en annan kan vara åldern i år för personen. / p>

Men vad är då betydelsen av storleken på en sådan vektor, som sedan skulle bildas genom en summering av m etrar och år? Och riktningen?

Jag vet om normalisering av funktioner för att få dem att ha liknande intervall, men min fråga är mer grundläggande.

Svar

Jag har problem med att förstå användningen av Vector i maskininlärning för att representera en grupp funktioner.

Kort sagt skulle jag säga att” Features Vector ”bara är ett bekvämt sätt att prata om en uppsättning funktioner.

Faktiskt, för varje etikett ”y ”(för att förutsägas), du behöver en uppsättning värden” X ”. Och ett mycket bekvämt sätt att representera detta är att sätta värdena i en vektor, så att när du tänker på flera etiketter, slutar du med en matris som innehåller en rad per etikett och en kolumn per funktion.

På ett abstrakt sätt kan du definitivt tänka på de vektorer som tillhör ett utrymme med flera dimensioner, men (vanligtvis) inte en n Euklidisk. Därför gäller all matematik, bara tolkningen skiljer sig!

Hopp som hjälper dig.

Kommentarer

  • Det är vilken typ av förvirrar mig: " inte en euklidisk ". Om det inte är en euklidisk, vilken typ är det då? Därav titeln: " Vilken typ av vektor är …. " Eller är jag specifik för att tolka " Euklidisk "?
  • Vektorrepresentationen underlättar bara bearbetning och statistisk analys. Om du letar efter en tolkning är detta inte längre en teknisk fråga och jag tror att du bara behöver tänka på ett mer abstrakt sätt, som om du försöker representera dig själv vad ett n-dimensionellt euklidiskt utrymme är. (n > 3)

Svar

Först kan vi prata om hur du organiserar dina data. Låt oss anta att du ordnar dina i ett kalkylark, där kolumner representerar dina funktioner och raderar dina olika prover. Tänk dig att du frågade tre personer om deras kön och ålder, så får du ett kalkylark med 3 rader (3 personer) och 2 kolumner (kön, ålder).

Nu kan du tolka varje rad som en enda funktionsvektor. I vårt exempel skulle funktionsvektorn ha två dimensioner (kön, ålder). Istället för fysik har (euklid.) Storleken på funktionsvektorn kanske ingen direkt användning för oss, eftersom dimensionerna kommer från olika domäner (jämför däremot en hastighetsvektor). Ändå kunde vi beräkna storleken (efter normalisering). Å andra sidan är riktningen för funktionsvektorn viktig, eftersom den representerar själva funktionsvärdena.

Sammantaget ska funktionsvektorer inte tolkas direkt som i fysik.

Svar

Vektorer har perspektiv från matematik, fysik och datavetenskap.

Jag föreslår att du går igenom Grant Sanderson ”s video på vektorer på sin kanal 3BLUE1BROWN eller snarare gå igenom hela serien på ESSENCE OF LINEAR ALGEBRA , för en bättre visuell förståelse av linjär algebra .

Pratar om funktionsvektorer , de är ingenting annat än en samling av alla funktioner (enskild egendom eller kännetecknande för ett fenomen som observeras) ordnat på ett specifikt sätt. Det är en n-dimensionell vektor med numeriska funktioner som representerar något objekt som krävs av maskininlärningsalgoritmerna. Gå bara igenom denna Wikipedia artikel varifrån jag har skrivit om funktionsvektorer.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *