로딩...
house price prediction
서울시 아파트 가격 예측에 대한
- 나는 내 학습목표를 달성하기 위해 무엇을 어떻게 했는가?
- 수업 진도표에 맞추서 강의를 수강
- 추가학습
- ensemble 등 강의를 들었지만 이해가 완전히 되지 않는 부분이 많았고 이를 해소하기 위해서 ChatGPT 를 통해 이해를 심화
numpy
,pandas
등 데이터 전환간 혼동피하기 위해 ChatGPT 를 활용
- 베이스코드 없이 시작을 하려고하니 아무것도 떠오르지 않음
- 주어진 베이스코드 코드 한줄 한줄을 이해하려고 함
- 학습 과정에서 주어진 7단계 과정의 순서를 체화하려고 함
- 파라메터 튜닝
- gpu 셋업이 안되어 있어서 이를 설정
- optuna 를 통한 파라메터 튜닝을 시도
- 파라메터 튜닝하는 동안 이를 기록하기 위해 파일에 기록
- 마주한 한계는 무엇이며, 아쉬웠던 점은 무엇인가?
- 이해 부족
- 여러가지 모델중 어떤 모델을 선택해야하는 지에 대한 지식의 부재
- 폴드나, 평가 지표에 대한 이해 부족
- 데이터 처리 사이클을 정해진 것인데 이 때문에 체계적으로 일을 진행하지 못하면서 비효율적으로 시간을 소모
- 익숙하지 않음
- 툴/라이브러리 에 익숙해지는데 시간이 소요됨
- 예측해야하는 타겟에 대한 정확한 이해
- 기간이 정해져있었음
- 협업이 원할지 않았던 팀이라 시너지가 없었던 것이 아쉬웠으나 개인 공부하기도 바빴던 수준이었다.
- 대회와 베이스라인 코드에 대한 설명 강의가 있는 것을 대회가 끝나고 알았음
- 이해 부족
- 한계/교훈을 바탕으로 다음 경진대회에서 시도해보고 싶은 점은 무엇인가?
- 컴퓨팅 자원 효율 최대화
- EDA 부터 제출까지의 사이클을 먼저 돌려서 추가적인 EDA를 하는 중에도 자원을 쉬지 않게 하는 목표
- 데이터 처리 사이클은 정해진 것이므로 이를 순서대로 진행해서 빠른 사이클 완성
- 쥬피터의 효과적인 활용
- 길어지면 재사용성이 덜어지는 것으로 생각됨
- 단계를 파일 단위 output 을 생산하고 다음 파일로 진행
- 컴퓨팅 자원 효율 최대화