機能のグループを表すための機械学習でのVectorの使用を理解するのに問題があります。
ベクトルの定義では、ウィキペディアによれば、ベクトルは大きさと方向を持つエンティティです。
これは、力、速度、加速度などを表すために、たとえば物理学にベクトルを適用するときに理解できます。 ..:ベクトルのコンポーネントは、空間内の軸に沿った物理プロパティのコンポーネントを表します。たとえば、速度ベクトルのコンポーネントは、x、y、z軸に沿った速度を表します
ただし、ベクトルを機械学習に適用して特徴を表す場合、それらの特徴は完全に無関係なエンティティである可能性があり、まったく異なる単位を持つ可能性があります。1つの特徴は人のメートル単位の長さであり、別の特徴は人の年齢である可能性があります。
しかし、そのようなベクトルの大きさの意味は何ですか。これは、mの合計によって形成されます。 etersと年?そして方向性は?
機能を正規化して同様の範囲にすることは知っていますが、私の質問はもっと基本的です。
回答
機能のグループを表すための機械学習でのVectorの使用を理解するのに問題があります。
要するに、「FeaturesVector」は便利な方法だと思います一連の機能について話します。
実際、各ラベルの「y “(予測される)には、値のセット” X “が必要です。これを表す非常に便利な方法は、値をベクトルに入れることです。これにより、複数のラベルを検討すると、次のような行列が作成されます。ラベルごとに1行、機能ごとに1列。
抽象的な方法で、多次元空間に属するベクトルを確実に考えることができますが、(通常は) nユークリッド1。したがって、すべての計算が適用され、解釈のみが異なります!
お役に立てば幸いです。
コメント
- それがどのような種類かです。の混乱:"ユークリッドではありません"。ユークリッドでない場合、それはどのようなものですか?したがって、タイトル:"ベクトルの種類は…. "または、ユークリッド"?
- ベクトル表現は、処理と統計分析を容易にするだけです。解釈を探しているのであれば、これはもはや技術的な問題ではなく、n次元のユークリッド空間が何であるかを自分で表現しようとするかのように、より抽象的な方法で考える必要があると思います。 (n > 3)
回答
最初に話しましょうデータを整理する方法について。列が機能を表し、行がさまざまなサンプルを表すスプレッドシートで整理するとします。 3人に性別と年齢を尋ねると、3行(3人)と2列(性別、年齢)のスプレッドシートが表示されます。
これで、すべての行を単一の特徴ベクトルとして解釈できます。この例の場合、特徴ベクトルは2つの次元(性別、年齢)を持ちます。物理学の代わりに、特徴ベクトルの(ユークリッド)大きさは、次元が異なるドメインから来ているため、直接使用できない場合があります(対照的に速度ベクトルを比較してください)。それにもかかわらず、(正規化後の)大きさを計算することができました。一方、特徴ベクトルの方向は、特徴値自体を表すため重要です。
すべての特徴ベクトルは、物理学のように直接解釈されるべきではありません。
回答
ベクトルには、数学、物理学、コンピューターサイエンスの観点からの視点があります。
チャンネルivid =の Grant Sanderson ベクターのビデオをご覧になることをお勧めします。 “691d1ef36e”>
3BLUE1BROWN または、 ESSENCE OF LINEAR ALGEBRA のシリーズ全体を読んで、線形代数を視覚的に理解します。 。
機能ベクトルについて話すと、それらはすべての機能のコレクションにすぎません(個別のプロパティまたは、観察されている現象の特徴)を特定の方法で配置します。これは、機械学習アルゴリズムに必要なオブジェクトを表す数値特徴のn次元ベクトルです。このWikipediaをご覧ください div id = “c2e06c560b”>
記事ここから特徴ベクトルについて書きました。