Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
Tags
- ASAC5기
- Python
- YouTube
- 머신러닝
- 데이터분석
- Machine learning
- ASAC14일차
- text summarization
- sql eda
- Shorts
- cnn optuna
- 파이썬 이미지 처리
- ASAC
- EDA
- ML
- SQL
- Crawling
- JSON
- BFS
- deep learning
- 백준
- pandas
- 크롤링
- 프로그래머스
- join
- DFS
- 뷰티 광고
- selenium
- CCP자격증
- 파이썬
Archives
- Today
- Total
낼름낼름 동동이
[ASAC 29일차] KNN 모델 본문
5월 7일의 기록
오늘은 드디어 머신러닝 팀프로젝트 주제를 좀 정할 수 있었다. 이번 주말 내내 생각을 했었지만 좀처럼 괜찮은 답을 내리기 어려워서 걱정을 많이 했었는데, 해결 되어 진짜 다행이다.
고민하던 걸 글로 써내면서 끝까지 최대한 논리적인 결론을 지어야겠다 생각하면서 최대한 내가 생각하는 괜찮은 아이디어를 바탕으로 팀원들에게 이야기를 했더니 아이디어에 부족한 부분을 보충해줘서 그 덕분에 할 수 있는 것들이 많이 생긴 것 같다.
KNN
K Nearest-Neighborhood
- 기본 개념: 끼리끼리, 초록은 동색 → 그 사람에 대한 사항을 판단할 때, 그 사람의 친구로 판단하겠다는 일상 개념을 모델링화
- 분류 & 회귀 모두 가능하다.
- Instance Model: 학습 개념이 아닌 주어진 데이터들의 거리 계산으로 유사도를 판별한다.
중요한 Point
- 가깝다는 기준을 무엇으로 할 것인가?
- 나와 가까운 몇 명을 기준으로 할 것인가
Under-Fit vs Over Fit
- 나와 가까운 몇 명을 기준으로 할 것인가를 판단할 때, 중요한 점!!
K값 결정 방법
그런데, 나와 가까운 K명을 기준으로 할 땐 찐친(더 가까운 값)이라면 더 중요하게 생각해야 하지 않을까?
→ 이럴땐 동등한 K로 취급하지 않고 찐친에게 가중치를 주자!
'데이터분석' 카테고리의 다른 글
[ASAC 26일차] Machine learning 이론 (0) | 2024.04.30 |
---|