「特徴空間」の定義は何ですか?
たとえば、SVMについて読むときは、「特徴へのマッピング」について読みます。スペース”。 CARTについて読むとき、「特徴空間へのパーティション分割」について読みました。
特にCARTの場合、何が起こっているのかは理解していますが、いくつかの定義を見逃していると思います。
「特徴空間」の一般的な定義はありますか?
SVMカーネルやCARTについての洞察を深める定義はありますか?
コメント
- 特徴空間とは、データの特徴を表すために使用される特徴のコレクションを指します。たとえば、データが人物に関するものである場合、特徴空間は(Gender、Height、体重、年齢)。SVMでは、(性別、身長、体重、年齢^ 2、身長/体重)など、データを説明するために別の特性セットを検討する必要がある場合があります。これは別の機能へのマッピングです。スペース
- 読んでいる人の名前/タイトルを教えてください。
回答
特徴空間
特徴空間とは、変数が存在する$ n $次元を指します(ターゲット変数が存在する場合は含まれません)。 MLのタスクは特徴抽出であるため、この用語はMLの文献でよく使用されます。したがって、すべての変数を特徴と見なします。たとえば、次のデータセットについて考えてみます。
Target
- $ Y \ equiv $テスト期間後の車のタイヤの厚さ
変数
- $ X_1 \ equiv $テストで移動した距離
- $ X_2 \ equiv $テストの期間
- $ X_3 \ equiv $化学物質の量タイヤの$ C $
特徴空間は$ \ mathbf {R} ^ 3 $、より正確には、$ \ mathbf {R} ^ 3 $の正の象限です。 $ X $変数は正の量のみにすることができます。タイヤに関するドメイン知識は、車両が移動していた速度が重要であることを示唆している可能性があるため、別の変数$ X_4 $(これは特徴抽出部分です)を生成します。
- $ X_4 = \ frac {X_1} {X_2} \ equiv $テスト中の車両の速度。
これにより、古い特徴空間が新しい特徴空間に拡張されます。 $ \ mathbf {R} ^ 4 $。
マッピング
さらに、この例のマッピングは、$ \ mathbf {R} ^ 3 $から$への関数$ \ phi $です。 \ mathbf {R} ^ 4 $:
$$ \ phi(x_1、x_2、x_3)=(x_1、x_2、x_3、\ frac {x_1} {x_2})$$
コメント
- これは確率論のサンプル空間とどのように異なりますか?ただ尋ねる。知りたいのですが。
- 'は、同一ではないにしても、非常に似ています。データ生成分布$ D $を検討する場合、特徴空間は$ D $のサポートと同じです。
- Pilon 'の例が示すように、いくつかの新しい特徴を抽出することにより、特徴空間を増やすことができます。確率のサンプル空間は' tできません。 '徹底的な機能スペースは' tではありません。
- @ Cam.Davidson.Pilon誰かがインスピレーションを得ていますあなたの答えは次のようです: dataorigami.net/blogs/napkin-folding/ …
- @AIM_BLB that ' s me!