낼름낼름 동동이

[ASAC 29일차] KNN 모델 본문

데이터분석

[ASAC 29일차] KNN 모델

인죠인간 2024. 5. 7. 09:27

5월 7일의 기록

오늘은 드디어 머신러닝 팀프로젝트 주제를 좀 정할 수 있었다. 이번 주말 내내 생각을 했었지만 좀처럼 괜찮은 답을 내리기 어려워서 걱정을 많이 했었는데, 해결 되어 진짜 다행이다.

고민하던 걸 글로 써내면서 끝까지 최대한 논리적인 결론을 지어야겠다 생각하면서 최대한 내가 생각하는 괜찮은 아이디어를 바탕으로 팀원들에게 이야기를 했더니 아이디어에 부족한 부분을 보충해줘서 그 덕분에 할 수 있는 것들이 많이 생긴 것 같다.

KNN

K Nearest-Neighborhood

  • 기본 개념: 끼리끼리, 초록은 동색 → 그 사람에 대한 사항을 판단할 때, 그 사람의 친구로 판단하겠다는 일상 개념을 모델링화
  • 분류 & 회귀 모두 가능하다.
  • Instance Model: 학습 개념이 아닌 주어진 데이터들의 거리 계산으로 유사도를 판별한다.

 

 

 

중요한 Point

  • 가깝다는 기준을 무엇으로 할 것인가?
  • 나와 가까운 몇 명을 기준으로 할 것인가

 

Under-Fit vs Over Fit

  • 나와 가까운 몇 명을 기준으로 할 것인가를 판단할 때, 중요한 점!!

 

K값 결정 방법

 

그런데, 나와 가까운 K명을 기준으로 할 땐 찐친(더 가까운 값)이라면 더 중요하게 생각해야 하지 않을까?

→ 이럴땐 동등한 K로 취급하지 않고 찐친에게 가중치를 주자!

 

 

 

'데이터분석' 카테고리의 다른 글

[ASAC 26일차] Machine learning 이론  (0) 2024.04.30