Supervised Learning(지도학습) 과 Unsupervised Learning(자율학습)
Computer Engineering/Machine Learning 2014. 8. 9. 21:04 |기계학습의 방법들인 Supervised Learning(지도학습) 과 Unsupervised Learning(자율학습)을 정리해보고자 한다.
Supervised Learning
기계학습 방법중 하나로 속성들이 지정되어있는 Training Data(훈련 데이터)를 이용하여 새로운 데이터에 속성을 얻어내기 위한 방법이다. 즉 Supervised Learning은 분류방법이라고 생각하면된다. Training Data를 이용해 predictive model을 생성한 후 새로운 입력값을 받아 model에 적용시켜 해당하는 속성을 찾아내는 방법이다. 간단한 예시로 각 나이대별 선호하는 색깔이 있다하면 Training Data로 나이와 선호하는 색깔 정보를 학습시킨후 새로운 입력값으로 나이를 넣으면 이 나이대에 맞는 선호하는 색깔이 나올것이다.
Supervised Learning의 경우 성능 평가를 위해 Cross-Validation(교차검증)이 사용된다.
하지만 Training Data를 수작업 해야하는 등의 이유로 데이터가 적을 수 있다.
Unsupervised Learning
기계학습 방법중 하나로 입력된 데이터가 어떤식으로 구성되어있는지 확인할 수 있는 방법이다. 사용되는 이유로는 고차원의 데이터 집합의 차원을 감소시키기 위해 사용된다. Supervised Learning과 달리 사전정보가 없고 입력값에 대한 목표치(Label)이 주워지지 않는다. 즉 Unsupervised Learning은 주워지는 입력값을 관찰하고 집단화한다고 생각하면 된다. 예시로는 클러스터링이 있다.