Importanța scalării trăsăturilor în Machine Learning

Recent am avut de lucru la un sistem nesupravegheat de clasificare. Foloseam metode statistice de clustering (covarianța empirică în principal) și OCSVM(One Class Support Vector Machine), dar care aveau rezultate foarte proaste deși peste 99% din date formau un cluster bine definit(eliptic). Problema era cu o serie de outlieri foarte îndepărtați, care făceau foarte problematică […]

Send this to a friend