Am probleme cu înțelegerea utilizării Vectorului în învățarea automată pentru a reprezenta un grup de caracteristici.

Dacă se caută definiția unui vector, apoi, conform Wikipedia, un vector este o entitate cu o amplitudine și o direcție.

Acest lucru poate fi înțeles atunci când se aplică vectori, de exemplu, fizică pentru a reprezenta forța, viteza, accelerația etc. ..: componentele vectorului reprezintă componentele proprietății fizice de-a lungul axelor din spațiu. De exemplu, componentele unui vector viteză reprezintă viteza de-a lungul axelor x, y și z

Cu toate acestea, atunci când aplicați vectori la învățarea automată pentru a reprezenta caracteristici, atunci acele caracteristici pot fi entități total fără legătură. Ele pot avea unități total diferite: o caracteristică poate fi lungimea în metri a unei persoane și alta poate fi vârsta în ani a persoanei.

Dar care este semnificația magnitudinii unui astfel de vector, care ar fi format dintr-o însumare a m eteri și ani? Și direcția?

Știu despre normalizarea caracteristicilor pentru a le face să aibă intervale similare, dar întrebarea mea este mai fundamentală.

Răspuns

Am probleme cu înțelegerea utilizării Vector în învățarea automată pentru a reprezenta un grup de caracteristici.

Pe scurt , aș spune că” Vectorul caracteristicilor „este doar un mod convenabil să vorbim despre un set de caracteristici.

Într-adevăr, pentru fiecare etichetă „y „(pentru a fi prezis), aveți nevoie de un set de valori„ X ”. Și un mod foarte convenabil de a reprezenta acest lucru este să puneți valorile într-un vector, astfel încât, atunci când luați în considerare mai multe etichete, să ajungeți la o matrice, care conține un rând pe etichetă și o coloană pe caracteristică.

În mod abstract, vă puteți gândi cu siguranță la acei vectori care aparțin unui spațiu cu dimensiuni multiple, dar (de obicei) nu n unul euclidian. Prin urmare, se aplică toate matematicile, doar interpretarea diferă!

Sper că te ajută.

Comentarii

  • Acesta este tipul of mă încurcă: " nu unul euclidian ". Dacă nu este un euclidian, atunci ce fel este? De aici și titlul: " Ce fel de vector este … " Sau sunt specific să interpretez " Euclidean "?
  • Reprezentarea vectorială facilitează doar prelucrarea și analiza statistică. Dacă căutați o interpretare, aceasta nu mai este o întrebare tehnică și cred că trebuie doar să vă gândiți într-un mod mai abstract, ca și cum ați încerca să vă reprezentați ce este un spațiu euclidian n-dimensional. (n > 3)

Răspuns

Mai întâi să vorbim despre cum să vă organizați datele. Să presupunem că vă organizați într-o foaie de calcul, unde coloanele reprezintă caracteristicile dvs. și rândurile diferitelor probe. Imaginați-vă că ați întrebat 3 persoane despre sexul și vârsta lor, apoi veți obține o foaie de calcul cu 3 rânduri (3 persoane) și 2 coloane (sex, vârstă).

Acum puteți interpreta fiecare rând ca un singur vector de caracteristică. În cazul nostru de exemplu, vectorul caracteristică ar avea 2 dimensiuni (sex, vârstă). În loc de fizică, magnitudinea (euclidă) a vectorului caracteristică ar putea să nu aibă o utilizare directă pentru noi, deoarece dimensiunile provin din domenii diferite (în contrast, comparăm un vector viteză). Cu toate acestea, am putea calcula magnitudinea (după normalizare). Pe de altă parte, direcția vectorului caracteristică este importantă, deoarece reprezintă valorile caracteristicii în sine.

În general, vectorii caracteristici nu ar trebui să fie interpretate direct așa cum faceți în fizică.

Răspuns

Vectorii au perspectivă din punctul de vedere al matematicii, fizicii și informaticii.

Vă sugerez să parcurgeți Grant Sanderson „s video pe vectori pe canalul său 3BLUE1BROWN sau, mai degrabă, parcurgeți întreaga sa serie pe ESENȚA ALGEBREI LINEARE , pentru o mai bună înțelegere vizuală a algebrei liniare .

Vorbind despre vectori de caracteristici , nu sunt altceva decât o colecție de toate caracteristicile (proprietate individuală sau caracteristică unui fenomen observat) aranjat într-un mod specific. Este un vector n-dimensional al trăsăturilor numerice care reprezintă un obiect care este cerut de algoritmii de învățare automată. Doar parcurgeți această Wikipedia articol de unde am scris despre vectori de caracteristici.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *