[머신러닝] 05. 비지도학습 (unsupervised learning)

강좌 출처

아래 링크의 강좌를 학습한 내용입니다.

머신러닝1 - 비지도 학습

비지도학습

비지도학습을 통해 가지고 있는 데이터의 새로운 의미나 관계를 밝혀낼 수 있다.

05_1

군집화 (clustering)

  • 비슷한 것을 찾아서 그룹을 만드는 것

05_2

군집화 vs. 분류

비슷한 것들끼리 나눈다라는 부분에선 의미가 혼동될지도 모르겠지만, 군집화와 분류는 서로 다르다.

05_3

군집화의 과정

  • 데이터를 좌표화 한다.
  • 가까운 것들 끼리 모아 하나의 그룹을 만든다.
    • 좌표상에서 가깝다는 것은 데이터가 비슷하다는 것을 의미한다.

05_4

하지만 행의 수가 6개가 아닌 1000만이 넘어간다면 일일이 하나하나 비교할 수 없게 된다. 그것을 가능하게 해주는 것이 군집화이다.

05_5

연관 규칙 (association rule)

  • 서로 연관된 특징(열)을 찾아내는 것
  • 주로 추천과 관련된 부분에 연관규칙이 사용된다.
  • 일명 장바구니 분석

05_6

라면을 사는 사람들은 모두 계란을 산다. 라면과 계란은 서로 연관되는 특징이다.
05_7

군집화 vs. 연관 규칙

요약하자면 군집화는 행(row)을, 연관 규칙은 열(column)을 그룹핑해주는 것이다.

05_8

변환 (transform)

  • 데이터를 새롭게 표현하여 사람이나 다른 머신러닝 알고리즘이 원래 데이터보다 쉽게 해석할 수 있도록 만드는 것

05_9

차원축소 (dimension reduction)

  • 특성이 많은 고차원의 데이터의 중요하지 않은 특성을 빼서 꼭 필요한 특징만 데이터로 표현하는 것
  • 차원축소의 대표적인 예로 시각화를 위해 데이터를 2차원으로 변경하는 경우가 있다.

지도학습 vs. 비지도학습

  • 지도학습과 비지도학습의 차이점

05_10

Leave a comment