Pääkomponenttianalyysin (PCA) kehyksestä on monia muunnelmia erillisille muuttujille tai kvantitatiivisten ja diskreettien muuttujien seokselle.

Kuva tästä kirjasta .

En kuitenkaan ole täysin selvä siitä, miten nämä menetelmät eroavat PCA: sta samalla tietojoukolla, mutta kvalitatiivisten muuttujien koodauksella yksi kuuma / näennäismuuttuja. Luin ristiriitaisia lausuntoja siitä, että nuken koodaus on mahdollinen, mutta merkityksetön.

Sikäli kuin voin ymmärtää täällä , pääongelma on noin käsitteen laajentaminen varianssi-kovarianssimatriisi erillisten muuttujien tapauksessa. Mutta miksi tätä laajennusta edes tarvitaan? Eikö nuken ja kvantitatiivisen muuttujan kovarianssilla ole järkeä? Vai kahden nuken muuttujan välillä?

Minulla on intuitio, että loppujen lopuksi ainoa ero on nuken suhteellisessa painossa verrattuna määrällisiä muuttujia, mutta minun on vaikea näyttää se muodollisesti. Ja jos olen väärässä, voinko selittää miksi?

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *