[머신러닝] 05. 비지도학습 (unsupervised learning)
강좌 출처
아래 링크의 강좌를 학습한 내용입니다.
비지도학습
비지도학습을 통해 가지고 있는 데이터의 새로운 의미나 관계를 밝혀낼 수 있다.
군집화 (clustering)
- 비슷한 것을 찾아서 그룹을 만드는 것
군집화 vs. 분류
비슷한 것들끼리 나눈다라는 부분에선 의미가 혼동될지도 모르겠지만, 군집화와 분류는 서로 다르다.
군집화의 과정
- 데이터를 좌표화 한다.
- 가까운 것들 끼리 모아 하나의 그룹을 만든다.
- 좌표상에서 가깝다는 것은 데이터가 비슷하다는 것을 의미한다.
하지만 행의 수가 6개가 아닌 1000만이 넘어간다면 일일이 하나하나 비교할 수 없게 된다. 그것을 가능하게 해주는 것이 군집화이다.
연관 규칙 (association rule)
- 서로 연관된 특징(열)을 찾아내는 것
- 주로 추천과 관련된 부분에 연관규칙이 사용된다.
- 일명 장바구니 분석
라면을 사는 사람들은 모두 계란을 산다. 라면과 계란은 서로 연관되는 특징이다.
군집화 vs. 연관 규칙
요약하자면 군집화는 행(row)을, 연관 규칙은 열(column)을 그룹핑해주는 것이다.
변환 (transform)
- 데이터를 새롭게 표현하여 사람이나 다른 머신러닝 알고리즘이 원래 데이터보다 쉽게 해석할 수 있도록 만드는 것
차원축소 (dimension reduction)
- 특성이 많은 고차원의 데이터의 중요하지 않은 특성을 빼서 꼭 필요한 특징만 데이터로 표현하는 것
- 차원축소의 대표적인 예로 시각화를 위해 데이터를 2차원으로 변경하는 경우가 있다.
지도학습 vs. 비지도학습
- 지도학습과 비지도학습의 차이점
Leave a comment