일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- BFS
- pandas
- sql eda
- YouTube
- ASAC5기
- Crawling
- SQL
- join
- 데이터분석
- 크롤링
- 파이썬 이미지 처리
- 백준
- ASAC14일차
- JSON
- selenium
- cnn optuna
- Shorts
- deep learning
- ML
- 뷰티 광고
- text summarization
- CCP자격증
- ASAC
- Machine learning
- DFS
- 파이썬
- EDA
- 프로그래머스
- 머신러닝
- Python
- Today
- Total
목록ML (2)
낼름낼름 동동이

0. 패키지 + 임포트import pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom google.colab import drivedrive.mount('/content/drive')data = pd.read_csv('/content/drive/MyDrive/real_final.csv')1. X, Y 값 분리X_features = data.drop(["viewCount_log", 'viewCount', 'videoId', 'channelId'], axis = 1)y_label = data["viewCount_log"]X_features.info() 결과 2. 데이터 상관관계 체크corrcoef = X_features.corr()plt..
ASAC의 ML 프로젝트를 마무리하고 나서, 마음이 맞는 몇몇 팀원들과 함께 프로젝트를 이어가기로 했다. 이번에는 메타데이터뿐만 아니라 시청각 데이터를 포함하여 조회수를 예측하는 머신러닝 모델을 만들어보려고 했다. 단순히 포트폴리오용이 아닌, 성능을 개선하여 학회에 제출할 수 있을 만큼 발전시키기로 목표를 세웠다.실제로 발표된 논문을 보았을 떄, 유튜브 동영상의 조회수를 예측하는 모델 연구는 활발하게 이루어져 왔으나 2021년 7월 출시된 쇼츠의 조회수를 예측하는 선행 연구는 비교적 부족함에 따라 뷰티 광고 중 유튜브 쇼츠에 특화된 조회수 예측 모델을 만들어보기로 하였다. 내가 맡게 된 역할팀원들과 회의를 통해 데이터 수집 및 전처리에 대한 역할을 분담했다. 데이터를 수집하고 전처리하는 과정은 나눠서 하..