일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- Python
- 파이썬
- text summarization
- sql eda
- BFS
- JSON
- SQL
- ML
- 백준
- ASAC5기
- DFS
- Crawling
- 크롤링
- selenium
- 머신러닝
- pandas
- EDA
- Shorts
- ASAC
- join
- Machine learning
- 파이썬 이미지 처리
- YouTube
- cnn optuna
- 뷰티 광고
- ASAC14일차
- CCP자격증
- deep learning
- 데이터분석
- 프로그래머스
- Today
- Total
목록YouTube (3)
낼름낼름 동동이

0. 패키지 + 임포트import pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom google.colab import drivedrive.mount('/content/drive')data = pd.read_csv('/content/drive/MyDrive/real_final.csv')1. X, Y 값 분리X_features = data.drop(["viewCount_log", 'viewCount', 'videoId', 'channelId'], axis = 1)y_label = data["viewCount_log"]X_features.info() 결과 2. 데이터 상관관계 체크corrcoef = X_features.corr()plt..
음원 데이터 수집유튜브 영상 ID만 있다면 메타 데이터는 youtube data api를 사용해서 수집 가능하며, 시청각 데이터는 pytube, youtube_DL 패키지와 librosa 패키지를 활용하면 수집하여 전처리도 가능해진다.1. 환경 설치 + Import# !pip install pytube# !pip install pydub # 두가지 활용해보고 youtube-dl이 가장 에러 없이 처리가 되어 이렇게 진행!pip install ffmpeg!pip3 install youtube-dl!pip3 install librosa!pip install matplotlib!pip3 install soundfilexfrom yt_dlp import YoutubeDLimport timeimport panda..
ASAC의 ML 프로젝트를 마무리하고 나서, 마음이 맞는 몇몇 팀원들과 함께 프로젝트를 이어가기로 했다. 이번에는 메타데이터뿐만 아니라 시청각 데이터를 포함하여 조회수를 예측하는 머신러닝 모델을 만들어보려고 했다. 단순히 포트폴리오용이 아닌, 성능을 개선하여 학회에 제출할 수 있을 만큼 발전시키기로 목표를 세웠다.실제로 발표된 논문을 보았을 떄, 유튜브 동영상의 조회수를 예측하는 모델 연구는 활발하게 이루어져 왔으나 2021년 7월 출시된 쇼츠의 조회수를 예측하는 선행 연구는 비교적 부족함에 따라 뷰티 광고 중 유튜브 쇼츠에 특화된 조회수 예측 모델을 만들어보기로 하였다. 내가 맡게 된 역할팀원들과 회의를 통해 데이터 수집 및 전처리에 대한 역할을 분담했다. 데이터를 수집하고 전처리하는 과정은 나눠서 하..