군집화

Notice

Recent Posts

Tags more

Archives

관리 메뉴

BASEMENT

Programming/Machine Learning

2_34 2020. 10. 10. 19:54

1. 비지도학습(Unsupervised Learning)

- 정답이 없음 (label이 없음)

- 목표값을 정해주지 않아도 되고 사전 학습이 필요 없으므로 속도가 빠름

- 지도학습에서의 적절한 feature를 찾아내기 위한 전처리 방법으로 사용됨

2. 종류

1) 클러스터링

- K-means : 임의의 중심점(K) 기준 최소 거리 기반 군집화

- Hierarchical Clustering (계층적 군집화) : 특정 알고리즘에 의해 데이터를 연결하여 계층적 클러스터를 구성해 나가는 방법

- DBSCAN : 반경 내 데이터 벡터 밀도 기반 군집화

2) 차원 축소

- t-SNE

- 주성분 분석(PCA) : 사물의 주요 특징 분석 및 추출. 차원축소, 축 상의 투영으로 표시 (이미지에서 주로 사용)

3. 군집화

- 비슷한 특성을 가진 데이터들끼리 그룹화함

- 같은 그룹내 요소들은 아주 유사하고, 다른 그룹과는 확연히 다름

- 목적 : 데이터 정보가 없는 경우 라벨링을 해줌 -> 라벨링 후 분류 모델 적용 -> 성능비교 가능

- 클러스터링은 눈에 잘 보일 수 있도록 시각화 하는 것이 중요함 (특히 scatter plot)

'Programming/Machine Learning' Related Articles

Comments