Estou tendo problemas para entender o uso do vetor no aprendizado de máquina para representar um grupo de recursos.
Se alguém pesquisar o definição de um vetor, então, de acordo com a wikipedia, um vetor é uma entidade com uma magnitude e direção.
Isso pode ser entendido quando se aplica vetores a, por exemplo, física para representar força, velocidade, aceleração, etc. ..: os componentes do vetor representam os componentes da propriedade física ao longo dos eixos no espaço. Por exemplo, os componentes de um vetor de velocidade representam a velocidade ao longo dos eixos x, y e z
No entanto, ao aplicar vetores ao aprendizado de máquina para representar recursos, esses recursos podem ser entidades totalmente não relacionadas. Eles podem ter unidades totalmente diferentes: um recurso pode ser o comprimento em metros de uma pessoa e outro pode ser a idade em anos da pessoa.
Mas então qual é o significado da magnitude de tal vetor, que seria então formado por uma soma de m eters e anos? E a direção?
Eu sei sobre normalização de recursos para fazê-los ter intervalos semelhantes, mas minha pergunta é mais fundamental.
Resposta
Estou tendo problemas para entender o uso do vetor no aprendizado de máquina para representar um grupo de recursos.
Resumindo , eu diria que” Vetor de características “é apenas uma maneira conveniente para falar sobre um conjunto de recursos.
Na verdade, para cada rótulo “y “(para ser previsto), você precisa de um conjunto de valores” X “. E uma maneira muito conveniente de representar isso é colocar os valores em um vetor, de forma que, ao considerar vários rótulos, você termine com uma matriz, contendo uma linha por rótulo e uma coluna por elemento.
De uma forma abstrata, você pode definitivamente pensar nesses vetores pertencentes a um espaço de dimensões múltiplas, mas (geralmente) não um n um euclidiano. Portanto, toda a matemática se aplica, apenas a interpretação difere!
Espero que ajude você.
Comentários
- Esse é o tipo de me confunde: " não um euclidiano ". Se não é um euclidiano, então de que tipo é? Daí o título: " Que tipo de vetor é …. " Ou estou sendo muito específico na interpretação de " Euclidiano "?
- A representação vetorial apenas facilita o processamento e a análise estatística. Se você está procurando uma interpretação, essa não é mais uma questão técnica e eu acho que você só precisa pensar de uma forma mais abstrata, como se você tentasse representar a si mesmo o que é um espaço euclidiano n-dimensional. (n > 3)
Resposta
Primeiro vamos conversar sobre como organizar seus dados. Vamos supor que você organize seus dados em uma planilha, onde as colunas representam seus recursos e as linhas, seus diferentes exemplos. Imagine que você perguntasse a 3 pessoas sobre seu sexo e idade e recebesse uma planilha com 3 linhas (3 pessoas) e 2 colunas (sexo, idade).
Agora você pode interpretar cada linha como um único vetor de recurso. Em nosso caso de exemplo, o vetor de recursos teria 2 dimensões (sexo, idade). Em vez da física, a magnitude (euclid.) Do vetor de características pode não ter uso direto para nós, uma vez que as dimensões vêm de domínios diferentes (em contraste, compare um vetor de velocidade). No entanto, podemos calcular a magnitude (após a normalização). Por outro lado, a direção do vetor de recursos é importante, pois representa os próprios valores dos recursos.
De modo geral, os vetores de recursos não devem ser interpretados diretamente como você faz na física.
Resposta
Os vetores têm perspectiva do ponto de vista da Matemática, Física e Ciência da Computação.
Eu sugiro que você assista ao Grant Sanderson “s vídeo sobre vetores em seu canal 3BLUE1BROWN ou melhor, passe por toda a sua série em ESSENCE OF LINEAR ALGEBRA , para uma melhor compreensão visual da Álgebra Linear .
Falando sobre vetores de recursos , eles nada mais são do que uma coleção de todos os recursos (propriedade individual ou característica de um fenômeno que está sendo observado) organizado de uma maneira específica. É um vetor n-dimensional de características numéricas que representam algum objeto exigido pelos algoritmos de aprendizado de máquina. Basta acessar esta Wikipedia artigo de onde escrevi sobre vetores de recursos.