Minulla on vaikeuksia ymmärtää vektorin käyttöä koneoppimisessa edustamaan joukko ominaisuuksia.
Jos joku etsii vektorin määritelmä, sitten wikipedian mukaan vektori on kokonaisuus, jonka suuruus ja suunta ovat.
Tämä voidaan ymmärtää soveltamalla vektoreita esimerkiksi fysiikkaan edustamaan voimaa, nopeutta, kiihtyvyyttä jne. ..: Vektorin komponentit edustavat fyysisen ominaisuuden komponentteja avaruuden akseleita pitkin. Esimerkiksi nopeusvektorin komponentit edustavat nopeutta pitkin x-, y- ja z-akseleita.
Kuitenkin Sovellettaessa vektoreita koneoppimiseen edustamaan ominaisuuksia, ne voivat olla täysin toisistaan riippumattomia kokonaisuuksia. Niillä voi olla täysin erilaiset yksiköt: yksi ominaisuus voi olla henkilön pituus metreinä ja toinen voi olla henkilön ikä vuosina.
Mutta mitä sitten tarkoittaa tällaisen vektorin suuruus, joka sitten muodostettaisiin summaamalla m eetterit ja vuodet? Ja suunta?
Tiedän ominaisuuksien normalisoinnista, jotta niillä olisi samanlaiset alueet, mutta kysymykseni on perustavanlaatuisempi.
Vastaa
Minulla on vaikeuksia ymmärtää vektorin käyttöä koneoppimisessa ominaisuusryhmän edustamiseksi.
Lyhyesti sanottuna sanoisin, että” Ominaisuudet-vektori ”on vain kätevä tapa puhua joukosta ominaisuuksia.
Todellakin, jokaiselle tunnisteelle ”y ”(ennustetaan), tarvitset joukon arvoja” X ”. Ja erittäin kätevä tapa esittää tämä on laittaa arvot vektoriin siten, että kun tarkastelet useita tarroja, päädyt matriisiin, joka sisältää yksi rivi per tarra ja yksi sarake per ominaisuus.
Abstraktilla tavalla voit ehdottomasti ajatella vektoreita, jotka kuuluvat moniulotteiseen tilaan, mutta (yleensä) eivät n euklidinen. Siksi kaikki matematiikka pätee, vain tulkinta eroaa!
Toivottavasti sinua auttaa.
Kommentit
- Juuri niin sekoittaa minua: " ei euklidinen ". Jos se ei ole euklidealainen, millainen se on? Tästä syystä otsikko: " Millainen vektori on … " Vai aionko tarkentaa euklidinen "?
- Vektoriesitys vain helpottaa käsittelyä ja tilastollista analyysiä. Jos etsit tulkintaa, tämä ei ole enää tekninen kysymys, ja mielestäni sinun on vain ajateltava abstraktimmin, ikään kuin yrität edustaa itseäsi, mikä on n-ulotteinen euklidinen tila. (n > 3)
Vastaa
Anna ensin puhua Oletetaan, että järjestät laskentataulukon, jossa sarakkeet edustavat ominaisuuksiasi ja rivejä eri näytteistäsi. Kuvittele, että kysyit kolmelta ihmiseltä heidän sukupuolestaan ja iästä, ja saat sitten laskentataulukon, jossa on 3 riviä (3 henkilöä) ja 2 saraketta (sukupuoli, ikä).
Nyt voit tulkita jokaisen rivin yhtenä ominaisuusvektorina. Esimerkkitapauksessamme ominaisuusvektorilla olisi 2 ulottuvuutta (sukupuoli, ikä). Fysiikan sijaan ominaisuusvektorin (euklidien.) Suuruudella ei ehkä ole suoraa käyttöä meille, koska mitat tulevat eri alueista (toisin kuin vertaa nopeusvektoria). Voimme kuitenkin laskea suuruuden (normalisoinnin jälkeen). Toisaalta ominaisuusvektorin suunta on tärkeä, koska se edustaa itse ominaisuusarvoja.
Kaiken kaikkiaan ominaisuusvektoreita ei tule tulkita suoraan kuten fysiikassa.
vastaus
Vektorilla on perspektiivi matematiikan, fysiikan ja tietojenkäsittelyn näkökulmasta.
Ehdotan, että käydään läpi Grant Sandersonin s video vektorista hänen kanavallaan 3BLUE1BROWN tai pikemminkin käy läpi hänen koko sarjaan LINEAARISEN ALGEBRAEN ESSENSI , jotta lineaarinen algebra ymmärrettäisiin paremmin .
Kun puhutaan ominaisuusvektoreista , ne ovat vain koko joukko kaikkia ominaisuuksia (Yksilöllinen ominaisuus tai havaittavan ilmiön ominaisuus) järjestetty tietyllä tavalla. Se on n-ulotteinen vektori numeerisista ominaisuuksista, jotka edustavat jotain koneen oppimisalgoritmien edellyttämää objektia. Käy vain tämän Wikipedian läpi artikkeli mistä olen kirjoittanut ominaisuusvektoreista.