질문 지켜보기

일반 질문

Q

정형, 시계열 데이터를 이용한 예측 모델 만들기

조회 513

좋아요 0

2023년 8월 8일

댓글 4

2023년 8월 9일
시계열 관련한 모형은 전통적인 통계모형(시계열 분석)이나 lstm과 같은 rnn(recurrent neural network) 계열의 파생모형을 통해 주로 분석합니다.
2023년 8월 9일
다만, 데이터의 형태가 단순한 예측, 분류 모형보다 복잡한 만큼, 정상성을 만족시켜야 하는 등 전처리와 eda에 조금 더 신경을 쓰셔야 합니다
2023년 8월 9일
제품 판매 추이를 예측하는데 정형 데이터와 시계열 데이터를 활용하려면 다양한 알고리즘과 접근 방법을 고려할 수 있습니다. 아래에 몇 가지 주요한 알고리즘과 접근 방법을 소개해드리겠습니다. ARIMA (Autoregressive Integrated Moving Average): 시계열 데이터 예측에 많이 사용되는 전통적인 방법 중 하나입니다. ARIMA는 자기회귀(AR), 누적차분(DI), 이동평균(MA) 요소들을 사용하여 시계열 데이터의 추세, 계절성 등을 모델링하고 예측합니다. Prophet: Facebook에서 개발한 시계열 예측 라이브러리로, 계절성 변동과 휴일 효과를 처리하는 데 강점이 있습니다. 사용이 간단하고 유연한 모델입니다. LSTM (Long Short-Term Memory): 딥러닝 중 하나인 LSTM은 순환 신경망(RNN)의 한 종류로 시계열 데이터를 모델링하는데 강력한 능력을 발휘합니다. LSTM은 시간적 의존성을 잘 처리하며 긴 시퀀스를 다루는 데 적합합니다. XGBoost 또는 LightGBM: 이런 그래디언트 부스팅 트리 모델은 정형 데이터와 시계열 데이터의 예측에도 적용할 수 있습니다. 트리 기반의 모델은 변수 중요도를 계산하고 시계열 데이터의 패턴을 잡아낼 수 있습니다. DeepAR: Amazon에서 개발한 확률적 시계열 예측 모델로, 딥러닝과 확률론을 결합하여 불확실성을 고려한 예측을 수행합니다. 모델 선택에 앞서 몇 가지 고려해야 할 점: 데이터 특성과 분포: 데이터의 특성과 분포에 따라 모델을 선택해야 합니다. 계절성: 데이터에 계절성이 있는지 확인하고, 계절성을 적절히 처리할 수 있는 모델을 선택합니다. 불확실성: 미래 예측의 불확실성을 얼마나 고려할지 고려해야 합니다. 또한 데이터 전처리, 모델 파라미터 튜닝, 검증 및 평가 등도 중요한 과정이므로, 전체적인 프로세스를 신중하게 계획하고 실행해야 합니다. 최종적으로는 여러 모델을 시도해보고 성능을 비교하여 가장 적합한 모델을 선택하는 것이 좋습니다.
2023년 8월 9일
요즘 유행하는 알고리즘을 찾아 보았는데, Prophet(Facebook 개발)이나 DeepAR(Amazon 개발)과 같은 알고리즘도 추가적으로 확인해 보시면 좋을 것 같습니다!

(주) 코드잇

대표강영훈

개인정보보호책임자강영훈

이메일support@codeit.kr

사업자 번호313-86-00797

통신판매업제 2019-서울중구-1034 호

주소서울특별시 중구 청계천로 100 시그니쳐타워 동관 10층 코드잇