저번 게시물에 이어 프로젝트를 준비하는 시간을 가졌고, 프로젝트 발표회까지 했다.
폐기물 발생량과 온실가스 배출량과의 상관관계 분석을 시작으로, 상관계수를 확인한 뒤 지구온난화의 심각성과 지구 온난화에 대비하는 기업의 ESG 경영을 권장하는 주제로 미니 프로젝트를 진행하였다.
폐기물 발생량과 온실가스 배출량을 상관관계 분석하는 코드는 지난 게시물에 올려놓았고, 같은 조원들이 CO2 배출량, 온실가스 배출량 데이터를 기반으로 예측할 수 있는 모델을 구축하였다.
이번 모델에서는 ARIMA라는 모델을 사용하였고, Tensorflow 혹은 Keras의 모델이 아닌 StatsModel 라이브러리를 사용하여 예측하였다. StatsModel의 ARIMA는 시계열 데이터(시간)을 학습하고 예측하는 데 유리한 모델이다.
하지만 시계열 데이터라고 한 들 연도별 데이터 밖에 없었기에 결과는 매끄럽게 출력될 수 없었다.
CO2 배출량을 예측하는 모델은 2020년을 기준으로 오차 범위가 굉장히 크게 난 모습을 확인할 수 있다.
다음은 온실가스 배출량인데, 온실가스 배출량도 마찬가지로 2018년도까지의 데이터로 모델을 학습시킨 후 2019년 데이터부터 예측을 했지만, 2019, 2020, 2021년도와의 오차 범위가 큰 모습을 볼 수 있었다.
주제 선정은 좋았지만, 학습 데이터가 압도적으로 부족했기에 정확도가 높은 모델을 기대할 순 없었다. 그렇기 때문에 미니 프로젝트 시상은 아쉽게도 다른 조가 받았지만, 다른 조가 그 만큼 준비를 잘 했었기에 미련은 없다.
다음 최종 프로젝트에서 원하는 결과를 얻을 수 있으면 좋을 것 같다.
'ABC부트캠프 데이터 탐험가 과정' 카테고리의 다른 글
[28일차] ABC 부트캠프 Transformer 모델을 이용한 자연어 처리(NLP) (1) | 2024.08.12 |
---|---|
[27일차] ABC 부트캠프 NVIDIA 교육과정1 (딥러닝기초) (0) | 2024.08.11 |
[25일차] ABC 부트캠프 미니 프로젝트 (0) | 2024.08.07 |
[24일차] ABC 부트캠프 FNN, RNN, LSTM (0) | 2024.08.06 |
[23일차] ABC 부트캠프 딥러닝과 CNN (0) | 2024.08.05 |