특징 그룹을 표현하기 위해 머신 러닝에서 Vector를 사용하는 것을 이해하는 데 어려움이 있습니다.
위키피디아에 따르면 벡터는 크기와 방향을 가진 개체입니다.
이는 힘, 속도, 가속도 등을 나타내는 물리에 벡터를 적용 할 때 이해할 수 있습니다. .. : Vector의 구성 요소는 공간의 축을 따라 물리적 속성의 구성 요소를 나타냅니다. 예를 들어 속도 벡터의 구성 요소는 x, y 및 z 축을 따라 속도를 나타냅니다.
그러나, 벡터를 기계 학습에 적용하여 기능을 표현할 때 이러한 기능은 완전히 관련이없는 개체가 될 수 있습니다. 완전히 다른 단위를 가질 수 있습니다. 하나의 기능은 사람의 길이 (미터 단위)이고 다른 하나는 사람의 나이 (년) 일 수 있습니다.
하지만 그런 벡터의 크기의 의미는 무엇입니까? m의 합으로 형성됩니다. eters와 년? 그리고 방향?
비슷한 범위를 갖도록 특성의 정규화에 대해 알고 있지만 제 질문은 더 근본적입니다.
답변
특징 그룹을 나타내는 머신 러닝에서 Vector를 사용하는 것을 이해하는 데 어려움이 있습니다.
간단히 말해서 “특징 벡터 “는 편리한 방법이라고 말하고 싶습니다. 기능 집합에 대해 설명합니다.
사실, 각 라벨 “y “(예측 되려면)”X “값 집합이 필요합니다. 그리고이를 나타내는 매우 편리한 방법은 값을 벡터에 넣는 것입니다. 여러 레이블을 고려할 때 다음을 포함하는 행렬로 끝납니다. 라벨 당 한 행과 특성 당 한 열.
추상적으로 이러한 벡터는 다차원 공간에 속하는 벡터를 확실히 생각할 수 있지만 일반적으로 n 유클리드 하나. 따라서 모든 수학이 적용되고 해석 만 다릅니다!
도움이되기를 바랍니다.
댓글
- 그게 바로 그런 것입니다. 저를 혼동합니다 : " 유클리드가 아닙니다 ". 유클리드가 아니면 어떤 종류입니까? 따라서 제목 : " 어떤 종류의 Vector는 …. " 아니면 Euclidean "?
- 벡터 표현은 처리 및 통계 분석을 용이하게합니다. 해석을 찾고 있다면 이것은 더 이상 기술적 인 질문이 아니며, 마치 n 차원 유클리드 공간이 무엇인지 자신을 표현하려는 것처럼 좀 더 추상적 인 방식으로 생각해야한다고 생각합니다. (n > 3)
답변
먼저 이야기합시다 데이터를 구성하는 방법에 대해 스프레드 시트에서 구성한다고 가정 해 보겠습니다. 여기서 열은 기능을 나타내고 다른 샘플은 행을 나타냅니다. 3 명에게 성별과 나이에 대해 질문 한 다음 3 행 (3 명)과 2 열 (성별, 연령)이있는 스프레드 시트를 얻는다고 가정 해보십시오.
이제 모든 행을 단일 특성 벡터로 해석 할 수 있습니다. 이 예에서 특징 벡터는 2 차원 (성별, 연령)을 갖습니다. 물리학 대신에 특성 벡터의 (유클리드.) 크기는 우리에게 직접적인 사용이 없을 수 있습니다. 차원이 다른 도메인에서 왔기 때문입니다 (반대로 속도 벡터를 비교). 그럼에도 불구하고 우리는 (정규화 후) 크기를 계산할 수 있습니다. 반면에 특성 벡터의 방향은 특성 값 자체를 나타 내기 때문에 중요합니다.
모든 특성 벡터의 모든 것을 물리학 에서처럼 직접 해석해서는 안됩니다.
답변
벡터는 수학, 물리학 및 컴퓨터 과학의 관점에서 관점을 갖습니다.
그의 채널 iv id =에서 Grant Sanderson의 벡터 관련 동영상 을 살펴 보시기 바랍니다. “691d1ef36e”>
3BLUE1BROWN 또는 ESSENCE OF LINEAR ALGEBRA 에 대한 전체 시리즈를 살펴보면 선형 대수를 시각적으로 더 잘 이해할 수 있습니다. .
특징 벡터 에 대해 이야기하면 모든 기능의 모음 일뿐입니다 (개별 속성 또는 관찰되는 현상의 특성) 특정 방식으로 배열됩니다. 기계 학습 알고리즘에 필요한 일부 객체를 나타내는 숫자 특성의 n 차원 벡터입니다. 위키 백과를 살펴보세요 기사