離散変数または量的変数と離散変数の混合に対する主成分分析(PCA)フレームワークには多くのバリエーションがあります。

この本の画像

ただし、これらのメソッドが同じデータセットのPCAとどのように異なるかについては完全にはわかりませんが、定性変数のワンホット/ダミー変数エンコーディングを使用します。ダミーエンコーディングは可能だが意味がないという矛盾した声明を読みました。

ここから理解できる限り、主な問題は離散変数の場合、分散共分散行列の概念を拡張します。しかし、なぜこの拡張機能が必要なのですか? 「ダミー変数と量的変数の間の共分散は意味がありませんか?または2つのダミー変数の間ですか?

最後に唯一の違いは、ダミーと比較したダミーの相対的な重みに関するものであるという直感があります。量的変数ですが、正式に表示するのに苦労しています。間違っている場合は、その理由を説明できますか?

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です