일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- YouTube
- Crawling
- 백준
- 프로그래머스
- 파이썬
- ML
- Shorts
- pandas
- DFS
- join
- Machine learning
- cnn optuna
- 뷰티 광고
- CCP자격증
- selenium
- SQL
- text summarization
- 파이썬 이미지 처리
- Python
- EDA
- 머신러닝
- 데이터분석
- ASAC
- ASAC14일차
- ASAC5기
- 크롤링
- JSON
- deep learning
- BFS
- sql eda
- Today
- Total
목록EDA (2)
낼름낼름 동동이

7월 2일의 기록기업연계 프로젝트로 진행하고 있는 yelp 리뷰 데이터 요약을 위해 데이터 탐색을 진행하였다. 시작 단계에서 헤매긴 했지만, 캐글에서 이전에 사람들이 많이 진행했던 방법이 있어서 이를 참조하면서 내용을 진행해보았다. 목차Yelp란?EDAYelp란?2004년 7월에 설립된 미국의 종합 평점 플랫폼 운영사이다. 미국을 중심으로 식당이나 배달등 로컬 기반의 평점을 비롯한 서비스를 제공하고 있다. (맛집을 찾기에 유용하다) 한국으로 따지면 배민, 네이버 지도, 카카오 맵등의 기능을 종합적으로 제공하는 곳이라고 생각할 수 있다.Yelp에는 맛집을 탐방했던 유저들이 남겨둔 후기들이 많이 모여있는데, 이 데이터가 오픈 되어 있다.EDA0. 라이브러리 및 함수import numpy as npimpor..

3월 21일의 기록 오전에는 엑셀의 기본적인 고급함수와 EDA의 기초에 대해서 배우게 되었는데, 전 회사에 다닐 때도 vlookup을 자주 쓰게 되다보니 엑셀을 배운적은 없어도 꽤나 익숙한 느낌이 들었다. 수업 첫날이라 필기를 너무 많이 하다보니 혼자서 필기를 정리한다고 시간을 많이 썼다. 앞으로는 수업 시간에 최대한 요약으로 써두고 글 정리에는 시간을 조금만 써서 시간을 효율적으로 써야겠다 1. 고급함수 1-1. 개요 엑셀에서는 수식에서 다른 셀에 있는 데이터를 포함해서 계산할 때, 해당하는 셀의 주소를 이용한다. 참조란 이런 셀의 주소를 가리키는 것을 말하는데, 그럼 참조를 왜 사용하는 걸까? 당연하게도 반복 작업(노가다)를 줄이기 위함이다. 엑셀을 잘한다는 것은 시간을 최대한 적게 써서 하고 싶은 ..