참고 논문 리딩
ETF 가격 방향성 예측을 위한 그래프 구조 학습 기반 신경망 -조현수, 김진기, 김태훈, 신기정
1. ETF를 선택한 이유
개별 종목은 위험도 높아서
2. 시계열 기반 모델의 한계점
서로 다른 종목들의 연관 관계를 반영하지 못함
(ETF는 추정 지수에 포함된 다양한 구성 종목에 대한 정보를 내포)
그래서 그래프 구조 학습 방법론 으로 각 ETF를 정점(node) 으로 가지는 그래프를 추론
추론된 그래프와 시계열 모델로부터 얻은 ETF 임베딩을 입력으로 그래프 신경망을 수행
그래서 단순한 시계열 모델로는 포착하기 어려운 종목 간의 상호 의존성을 파악가능
최종적으로 상승, 보합, 하락 확률을 예측함
포트폴리오 전체의 움직임을 예측하는데 유용
3. 모델
ARIMA
Exponential Smoothing
LSTM
GRU
Attention LSTM
DTML
4. 제안방법
ETF의 섹터정보로 그래프
- 가격데이터로 Attention LSTM을 통해 임베딩을 추론
- 이걸로 합성곱 신경망(GCN)으로 가격의 방향성을 예측
- 정규화는 오토인코더사용
5. 그래프 생성 과정
ETF 속성행렬 구성 - 임베딩 - 유사도계산(코싸인) - 그래프생성
6. 그래프를 가지고 Attention LSTM
1) 중요한 시점의 강조
- 모든 시점을 동일하게 다루는게 아니라 특정 이벤트가 발생한 시점의 데이터가 미래 예측에 더 중요한 경우를 고려하는 것임.
2) 정보 손실 감소
- LSTM은 장기 시계열 데이터를 처리하는 장점이 있긴하지만, 시간이 지남에 따라 초기 시점의 정보가 희석되는게 있음.
- 특히 중요한 정보에 가중치를 주어서 이 문제를 완화하는게 있음.
3) 모델 해석 가능성 향상
4) 성능 향상
7. GCN 기반 ETF 가격 방향성 예측
1) Attention LSTM과 GCN 결합
- 가격정보에서 추출한 임베딩 h를 생성. 이 임베딩은 시계열 데이터의 중요한 패턴을 반영
2) 그래프 구조 학습
- ETF들 간의 관계를 그래프 구조로 학습.
- ETF는 그래프의 노드(정점)로, ETF 간의 상관관계는 엣지(간선)으로 표현. 이렇게 ETF의 상호작용을 반영한다.
3) GCN 적용
- 그래프 구조와 Attention LSTM에서 생성된 임데딩값을 결합하여 가격방향성(상승, 보합, 하락)을 예측함.
즉, ETF 간의 상관관계를 반영하여 가격 방향성을 예측하는 것임.
8. 노이즈제거 (오토인코더)
입력 데이터를 압축하여 저차원 잠재 공간으로 매핑한 후, 다시 원래의 고차원 공간으로 복원하는 신경망 모델
-> 입력 데이터의 주요 특징을 추출하면서도 노이즈를 제거하는데 효과적
이 방법론을 이커머스에 적용
1. 이커머스 데이터의 특징
1) 다양한 시계열 데이터
매출 ,재고 수준, 회원 수, 접속자 수, 구매 전환율, 주문 수, 반품 및 교환 수, 광고 클릭 수, 장바구니 추가 수, 고객 서비스 요청, 페이지뷰, 결제 완료 수, 상품 검색 횟수, 고객 리뷰 및 평점, 프로모션 참여율 등등
2) 다중 변수 간의 상관관계
다양한 변수들과의 상관관계가 존재할 수 있음. 예를 들어 접속자가 많아질수록 매출이 증가할 가능성, 재고 수준이 매출에 미칠 영향 등등
2. 응용 가능성 분석
1) 매출 예측
- 특정 프로모션 기간 동안의 매출 패턴 분석하여 앞으로의 프로모션이 매출이 미치는 영향을 예측
- 특정 상품이나 카테고리의 계절적 수요 변화를 파악하고, 이에 따라 매출을 예측하여 재고 관리 및 마케팅 전략에 반영
2) 재고 관리 최적화
- 판매 데이터와 재고 데이터를 기반으로, 특정 상품의 재고가 언제 소진될지 예측하여 재고 부족 문제를 사전에 해결
- 상품별 재고 회전율을 분석하여, 어떤 상품이 빠르게 팔리고, 어떤 상품이 느리게 팔리는지 파악, 재고 최적화
3) 고객 행동 예측
- 접속자 수, 장바구니 추가, 페이지뷰 등의 데이터를 통해 고객의 구매 전환 가능성을 예측하고, 전환율을
높이기 위한 마케팅 전략 개발 가능
- 장바구니에 상품을 담은 고객이 실제로 구매하지 않고 이탈할 가능성을 예측하여, 이탈을 방지하는 할인쿠폰과 같은
서비스를 제공할 수 있음
4) 개인화 추천 시스템 개선
- 고객의 과거 구매 패턴, 검색 기록, 페이지뷰 데이터를 분석하여, 고객이 관심을 가질 가능성이 높은 상품을 추천
- 상관관계 기반으로 고객이 특정 상품을 구매할 때 자주 함께 구매하는 상품을 분석 -> 크로스셀링이라고 함.
5) 마케팅 캠페인 성과 분석
- 마케팅 전략이 매출에 미치는 영향을 예측하고, 그에 따른 투자 대비 수익 분석
- 광고 클릭 수, 방문자 수 등을 통해 광고 및 캠페인 효과 사전 평가 가능
6) 고객 세분화 및 타겟팅
- 고객 데이터를 분석하여 유사한 행동 패턴을 가진 고객 세그먼트를 식별. 세그먼트별 맞춤 전략 수립가능
- 고객 생애 가치 예측 -> VIP 고객 식별하고 이들을 위한 특별한 혜택을 제공하는 것도 가능
7) 수요 예측
- 과거 판매 데이터와 외부요인(계절, 이벤트) 결합하여, 특정 상품의 미래 수요 예측 - 재고 관리 및 공급 관리
- 신제품 출시 효과 분석
8) 이탈 고객 예측 및 유지
- 고객 이탈 예측 -> 로그인 빈도, 구매 빈도 등
9) 이커머스 플랫폼의 성능 최적화
- 트래픽 예측 및 서버 관리
'A.I.(인공지능) & M.L.(머신러닝) > 신경망 이론' 카테고리의 다른 글
GCN 코드를 통해 이해 (0) | 2024.08.14 |
---|---|
3. 초간단 신경망(3/3) (0) | 2024.02.24 |
2. 초간단 신경망(2/3) (0) | 2024.02.17 |
1. 초 간단 신경망(1/3) (0) | 2024.02.04 |