Am aflat că o caracteristică este o proprietate individuală măsurabilă a unui fenomen observat.
Spuneți, de exemplu, că reprezintă o ființă umană.
Apoi, diverse caracteristici ar putea fi vârsta, greutatea, înălțimea etc. Acum, dacă așez aceste caracteristici într-un vector, se formează un vector de caracteristici. Din ceea ce am, vectorul caracteristică (o matrice), în acest caz va avea trei elemente – primul fiind vârsta, apoi greutatea și, în final, înălțimea. În mod similar pentru „n” indivizi, aș avea „n” vectori de caracteristici având fiecare câte 3 elemente.
În acest context, ce este un set de caracteristici?
Răspuns
Un vector de caracteristică este un vector care stochează caracteristicile pentru o anumită observație într-o anumită ordine.
De exemplu, Alice are 26 de ani și o înălțime de 5 „6”. Vectorul ei de caracteristici ar putea fi [26, 5.5] sau [5.5, 26] în funcție de alegerea dvs. de a comanda elementele. Ordinea este importantă doar în măsura în care este consecventă .
Un set de caracteristici este un set cu toate atributele care vă interesează, de exemplu înălțimea și vârsta.
Presupunerea implicită a utilizării acestei terminologii este că datele dvs. sunt tabulare – cumva, ați ales să le reprezentați ca un format „plat”, asemănător matricei. Dar datele non-tabulare formate, cum ar fi graficele de rețea, video, audio, imagini, secvențe de date binare, … toate acestea necesită o cantitate de inginerie pentru a le reprezenta ca vectori de caracteristici.
Răspuns
Caracteristică: este o listă de numere, de exemplu: vârsta, numele, înălțimea, greutatea etc. ., asta înseamnă că fiecare coloană este o caracteristică în tabelul relațional.
Vectorul de caracteristică este reprezentarea unui anumit rând din tabelul relațional. Fiecare rând este un vector caracteristică, rândul „n” este un vector caracteristică pentru „n” eșantionul.
Featur e Set: Ajută la prezicerea variabilei de ieșire.
Exemplu: Pentru a prezice vârsta unei anumite persoane, trebuie să știm anul nașterii. Aici Set de caracteristici = Anul nașterii.
În mod normal, un set de caracteristici bun poate fi identificat folosind cunoștințe de domeniu expert sau abordare matematică.
Răspuns
Dintr-o perspectivă simplă a structurilor de date, diferența este că un set nu are ordine inerentă și nu conține duplicate (cf. o pungă de bile de loterie) în timp ce un vector are ordine și poate conține orice valoare (similară cu o matrice sau matrice unidimensională).