Jeg har problemer med at forstå brugen af Vector i maskinlæring til at repræsentere en gruppe af funktioner.
Hvis man ser op til definition af en vektor, så i henhold til wikipedia er en vektor en enhed med en størrelse og retning.
Dette kan forstås, når man anvender vektorer til for eksempel fysik til at repræsentere kraft, hastighed, acceleration osv. ..: komponenterne i vektoren repræsenterer komponenterne i den fysiske egenskab langs akserne i rummet. F.eks. repræsenterer komponenterne i en hastighedsvektor hastigheden langs x-, y- og z-akserne
Dog når du anvender vektorer til maskinlæring til at repræsentere funktioner, så kan disse funktioner være fuldstændigt uafhængige enheder. De kan have helt forskellige enheder: en funktion kan være længden i meter for en person, og en anden kan være alder i personens år.
Men hvad er så betydningen af størrelsen af en sådan vektor, som derefter ville blive dannet ved en summering af m etere og år? Og retningen?
Jeg ved noget om normalisering af funktioner for at få dem til at have lignende områder, men mit spørgsmål er mere grundlæggende.
Svar
Jeg har problemer med at forstå brugen af Vector i maskinindlæring til at repræsentere en gruppe af funktioner.
Kort sagt , vil jeg sige, at” Features Vector “bare er en bekvem måde at tale om et sæt funktioner.
Faktisk for hver etiket “y “(for at blive forudsagt), har du brug for et sæt værdier” X “. Og en meget bekvem måde at repræsentere dette på er at placere værdierne i en vektor, således at når du overvejer flere etiketter, ender du med en matrix, der indeholder en række pr. etiket og en kolonne pr. funktion.
På en abstrakt måde kan du helt sikkert tænke på de vektorer, der hører til et rum med flere dimensioner, men (normalt) ikke en n euklidisk. Derfor gælder al matematik, kun fortolkningen er forskellig!
Håber det hjælper dig.
Kommentarer
- Det er den slags af forvirrer mig: " ikke en euklidisk ". Hvis det ikke er euklidisk, hvilken slags er det da? Derfor titlen: " Hvilken slags vektor er …. " Eller er jeg specifik for at fortolke " Euklidisk "?
- Vektorrepræsentationen letter blot behandlingen og den statistiske analyse. Hvis du leder efter en fortolkning, er dette ikke længere et teknisk spørgsmål, og jeg tror, du skal bare tænke på en mere abstrakt måde, som om du prøver at repræsentere dig selv, hvad et n-dimensionelt euklidisk rum er. (n > 3)
Svar
Først lader vi tale om, hvordan du organiserer dine data. Lad os antage, at du organiserer dine i et regneark, hvor kolonner repræsenterer dine funktioner og rækker dine forskellige eksempler. Forestil dig, at du spurgte 3 personer om deres køn og alder, så får du et regneark med 3 rækker (3 personer) og 2 kolonner (køn, alder).
Nu kan du fortolke hver række som en enkelt funktionsvektor. I vores eksempel vil funktionsvektoren have 2 dimensioner (køn, alder). I stedet for fysik har størrelsen på (euklid.) Af funktionsvektoren muligvis ingen direkte anvendelse for os, da dimensionerne kommer fra forskellige domæner (sammenlign derimod en hastighedsvektor). Ikke desto mindre kunne vi beregne størrelsen (efter normalisering). På den anden side er retningen af funktionsvektoren vigtig, da den repræsenterer selve funktionsværdierne.
Alt i alt skal vektorer ikke direkte fortolkes som i fysik.
Svar
Vektorer har perspektiv fra matematik, fysik og datalogi.
Jeg foreslår, at du gennemgår Grant Sanderson “s video på vektorer på sin kanal 3BLUE1BROWN eller rettere gennemgå hele hans serie på ESSENCE OF LINEAR ALGEBRA for en bedre visuel forståelse af lineær algebra .
Når vi taler om funktionsvektorer , er de intet andet end en samling af alle funktionerne (Individuel ejendom eller karakteristisk for et fænomen, der observeres) arrangeret på en bestemt måde. Det er en n-dimensionel vektor med numeriske træk, der repræsenterer et objekt, der kræves af maskinindlæringsalgoritmerne. Gå bare gennem denne Wikipedia artikel , hvorfra jeg har skrevet om funktionsvektorer.