Jeg har problemer med å forstå bruken av Vector i maskinlæring for å representere en gruppe funksjoner.
Hvis man ser opp definisjon av en vektor, så i følge wikipedia er en vektor en enhet med størrelse og retning.
Dette kan forstås når man bruker vektorer til for eksempel fysikk for å representere kraft, hastighet, akselerasjon, etc. ..: komponentene i vektoren representerer komponentene til den fysiske egenskapen langs aksene i rommet. For eksempel representerer komponentene i en hastighetsvektor hastigheten langs x-, y- og z-aksene
Imidlertid, når du bruker vektorer til maskinlæring for å representere funksjoner, kan disse funksjonene være helt uavhengige enheter. De kan ha helt forskjellige enheter: en funksjon kan være lengden i meter til en person, og en annen kan være alderen i årene til personen. / p>
Men hva er så betydningen av størrelsen på en slik vektor, som da vil bli dannet av en summering av m etere og år? Og retningen?
Jeg vet om normalisering av funksjoner for å få dem til å ha lignende områder, men spørsmålet mitt er mer grunnleggende.
Svar
Jeg har problemer med å forstå bruken av Vector i maskinlæring for å representere en gruppe funksjoner.
Kort sagt , vil jeg si at» Features Vector «bare er en praktisk måte å snakke om et sett med funksjoner.
Faktisk, for hver etikett «y «(for å bli forutsagt) trenger du et sett med verdier» X «. Og en veldig praktisk måte å representere dette på er å sette verdiene i en vektor, slik at når du vurderer flere etiketter, ender du opp med en matrise som inneholder en rad per etikett og en kolonne per funksjon.
På en abstrakt måte kan du definitivt tenke på de vektorene som tilhører et rom med flere dimensjoner, men (vanligvis) ikke en n euklidisk. Derfor gjelder all matematikken, bare tolkningen er forskjellig!
Håper det hjelper deg.
Kommentarer
- Det er hva slags av forvirrer meg: " ikke en euklidisk ". Hvis det ikke er euklidere, hva slags er det da? Derav tittelen: " Hva slags vektor er …. " Eller er jeg spesifikk i å tolke " Euklidisk "?
- Vektorrepresentasjonen letter bare prosessering og statistisk analyse. Hvis du leter etter en tolkning, er dette ikke lenger et teknisk spørsmål, og jeg tror du bare trenger å tenke på en mer abstrakt måte, som om du prøver å representere deg selv hva et n-dimensjonalt euklidisk rom er. (n > 3)
Svar
Først kan vi snakke om hvordan du organiserer dataene. La oss anta at du organiserer dine i et regneark, der kolonnene representerer funksjonene dine og rader de forskjellige prøvene dine. Tenk deg at du spurte 3 personer om kjønn og alder, så får du et regneark med 3 rader (3 personer) og 2 kolonner (kjønn, alder).
Nå kan du tolke hver rad som en enkelt funksjonsvektor. I vårt eksempel vil funksjonsvektoren ha to dimensjoner (kjønn, alder). I stedet for fysikk kan størrelsen på (euklid.) Av funksjonsvektoren ikke ha noen direkte bruk for oss, siden dimensjonene kommer fra forskjellige domener (sammenlign derimot en hastighetsvektor). Likevel kunne vi beregne størrelsen (etter normalisering). På den annen side er retningen til funksjonsvektoren viktig, siden den representerer funksjonsverdiene i seg selv.
Alt i alt skal ikke vektorer tolkes direkte slik du gjør i fysikk.
Svar
Vektorer har perspektiv fra matematikk, fysikk og informatikk.
Jeg foreslår at du går gjennom Grant Sanderson «s video på vektorer på kanalen hans 3BLUE1BROWN eller rettere sagt gå gjennom hele serien hans på ESSENCE OF LINEAR ALGEBRA , for en bedre visuell forståelse av Lineær algebra .
Når vi snakker om funksjonsvektorer , er de ingenting annet enn en samling av alle funksjonene (Individuell eiendom eller karakteristisk for et fenomen som observeres) ordnet på en bestemt måte. Det er en n-dimensjonal vektor med numeriske trekk som representerer noe objekt som kreves av maskinlæringsalgoritmene. Bare gå gjennom denne Wikipedia artikkel der jeg har skrevet om funksjonsvektorer.