Statistics
-
SVM(Support Vector Machine)Statistics/개념 2019. 5. 14. 23:51
SVM 개념 정리 분류를 위한 머신러닝 방법 중 하나 각각 경계선은 두 분류되는 집단의 가장 가까운 점(Support Vector) 에 의해 결정된다. 두 개의 집단을 분류 하는 경계선이 존재할 때에 이 경계선의 넓이 즉, margin을 길이를 최대화 하도록 분류하는 방법 각각의 경계선과 관측치들간의 수직거리를 계산한다. w를 법선벡터라 할때 margin의 길이는 간단히 아래와 같이 나타나게 되며 마진값이 클 수록 더 경계선이 안정적이기 때문에 이 값을 최대화 시키는 알고리즘이다. 위의 값은 역순으로 뒤집으면 아래와 같은 값을 최소화 시키는 것과 같다. 이때 라그랑주 승수법이라는 방식을 이용하면 최소가 되는 법을 구할 수 있다. 하지만 실제 데이터가 정확하게 이분화 되는 것은 거의 존재하지 않는다. 따라..