'문병로 교수의 메트릭 스튜디오' 따라하기.
1. 인기주 비인기주 비교
그 첫번째 시간은 '1장. 확률게임' 중 '과거 데이터로 미래를 말할 수 있는가?'(p.45 ~ p.47)에 나타난
'비인기주와 인기주의 6개월 수익률 연도별 비교' 입니다.
과연 과거 데이터로 미래를 말할 수 있을까요?
이와 관련된 두가지 논점이 있습니다.
우선, 우리가 가진 데이터는 과거 데이터 밖에 없습니다. 즉 미래를 말할 방법은 과거의 확률로 미래를 예측하는 수 밖에 없습니다.
그리고, 미래 데이터에 대한 내성 문제가 있습니다. 어떤 알고리즘의 2004년 수익률을 보고 싶다면 2003년까지의 데이터를 기반으로 모델링을 하고 알고리즘을 개발한 뒤 2004년 수익률을 평가해야 합니다. 이런 식으로 실험을 진행해야 미래를 모르는 상태에서 투자를 한 것과 같기 때문에 알고리즘의 신뢰도가 높아집니다.
'인텔리퀀트 스튜디오' 의 경우 특정 시점에서 미래 데이터를 가져와서 참조할 방법이 없습니다.
책에 나온 대표적인 과거의 확률 '비인기주와 인기주의 6개월 수익률 연도별 비교'를 인텔리퀀트 스튜디오에서 백테스팅을 해보았습니다.
PBR은 주가를 BPS(주당순자산가치)로 나눈 값입니다. 주가가 주당 순자산의 몇 배로 매매되고 있는가를 볼 수 있는데. 흔히 1을 기준으로 높으면 인기주, 낮으면 비인기주로 볼 수 있습니다.
(https://ko.wikipedia.org/wiki/PBR)
실제로 아래 보이는 '내 알고리즘에 복사' 버튼을 누르고, '알고리즘' 페이지로 가서 해당 알고리즘을 시작일 '2007-04-01', 종료일 '2017-04-01', 예수금 '20억' 으로 세팅 후 시뮬레이션 실행을 하면 '잔고보유내역' 인기주(Popular) 에는 자주 들어봄직한 종목이 꽤 들어있고, 비인기주(Unpopular) 에는 그러한 종목의 비중이 낮은 것을 볼 수 있습니다.
알고리즘을 소개해보면
KOSPI 종목만을 대상으로 ETF 종목 제외. PBR 이 0 보다 작은 종목 제외. 거래중지 중인 종목을 제외하고.
이렇게 뽑힌 대상 종목들 중
인기주의 경우 PBR 이 1 이상인 종목 전체를 18억을 균일하게 나눠서 4월초에 사고 10월 초에 팔고,
비인기주의 경우 PBR 이 1 미만인 종목 전체를 18억을 균일하게 나눠서 4월초에 사고 10월 초에 팔기를 2007년 부터 10년간 매년 반복합니다.
예를 들어 인기주 100종목이 뽑히면 각 종목에 1천800만원 씩 매년 4월초에 매수하고 10월 초에 보유종목 전체를 매도합니다.
결과를 보면
인기주 수익률 | 비인기주 수익률 | |
2007년 |
13.05% |
16.98% |
2008년 |
-6.83% |
-4.31% |
2009년 | 3.96% |
13.25% |
2010년 | 1.94% |
3.71% |
2011년 | -4.45% |
-5.90% |
2012년 | -0.21% |
1.32% |
2013년 | -0.43% |
1.39% |
2014년 | 2.05% |
5.20% |
2015년 | 2.41% |
2.29% |
2016년 | 0.99% |
2.04% |
책에서 만큼 확연한 차이는 아닐지라도 기본적으로 비인기주의 수익률이 대체로 더 좋은 것을 볼 수 있습니다.
(이런한 차이는 알고리즘의 차이, 테스팅 년도의 차이 등 다양한 조건의 차이로 발생하지 않았을까 추측합니다.)
10년간 산술평균을 보면 인기주의 경우 1.25%, 비인기주의 겨우 3.60% 이고. 비인기주가 더 안좋았던 년도는 2011년, 2015년 두번뿐이며 2011년은 그 차이가 1.45%p, 2015년은 0.12%p 입니다.
지난 10년 간 인기주 보다 비인기주가 기본적으로 좋은 수익률이 나왔는데 굳이 인기주 위주의 투자를 할 이유가 있을까요?
* '문병로 교수의 메트릭 스튜디오' 따라하기는 책에 나오는 항목 중 일부를 따라가면서
'인텔리퀀트 스튜디오'에서 실제 백테스팅 하고, 수치를 검증하고,
동시에 알고리즘 코드 작성법을 배워보려는 의도로 기획된 시리즈 입니다.
* 인용을 허락해주신 문병로 교수님께 감사드립니다.