Skip to content

nananana-Banana/2021-nh-bigdata-competition

Repository files navigation

2021년(제2회) NH투자증권 빅데이터 경진대회

금융 | NH투자증권 | 주식 보유기간 예측 | RMSE | 참가&입상자 특전

대회 포스터

image


분석 주제

🔶 예선 주제

  • 고객의 특성과 거래 패턴 분석을 통한 주식 보유기간 예측

  • 당사가 제공하는 고객데이터에 참가자가 선택한 데이터를 결합하여 분석

예선 대회는 2021년 이전의 데이터를 학습하여, 아직 오지 않은 2021년 주식 보유 기간을 예측하는 과제를 풀어야 한다.이는 아직 2021년이 오지 않았다는 가정하에 문제를 풀어야 함을 의미.따라서 본 대회는 모든 2021년 데이터 사용을 금지함.

🔶 본선 주제

  • 서비스 아이디어 제안

본선 결과물은 예선 알고리즘에 대한 간결한 설명을 포함하여, 예선을 진행하면서 분석할 수 있었던 주식 보유 고객/고객이 보유했던 주식에 대한 인사이트를 활용하여 아이디어를 제안할 수 있다.

데이터 명세 읽어보면 좋을 듯


대회 소개 영상

데이콘 대회 소개 영상

NH 투자증권 대회소개 영상

내용 요약

데이터, 문화가 되다. 투자는 선택이 아니라 새로운 문화로 자리 잡았다.

2020년 말 기준 국내주식 개인투자자는 914만 명으로 2019년 614만 명 대비 300만 명이 증가했다. 이에 따라 개인투자자 주식 잔고도 2019년 419조 원에서 2020년 662조원으로 증가했다.

그렇다면 거래 데이터는 어디에 쌓이고 있을까?

NH투자증권은 207만 명(2021년 6월 기준)의 국내주식 보유고객이 있고, 월 평균 거래 데이터는 1억 7백만 건(2021년 기준)이다. NH투자증권은 모든 데이터를 당사의 빅데이터 플랫폼DAP에 쌓고 실시간으로분석함으로써 고객들에게 맞춤형 상품과 서비스를 제공하고있다.

금융데이터를 직접 다룰 기회! ... 증권 실무 데이터 핸들링 실제 경험 기회, 각종 혜택 있음


📝 목차


대회 주요 일정

  • 08.30 예선 시작 & 데이터 세트 공개

  • 08.30 - 10.12 예선

  • 10.12 8:00 예선 결과물 제출 마감(개발코드 및 개발 설명서 제출)

  • 10.12 - 10.21 예선 평가 기간

  • 10.22 예선 결과 발표 (50개 팀 선정)

  • 10.22 - 11.08 본선

  • 11.08 8:00 본선 보고서 PPT 제출 마감

  • 11.08 - 11.18 본선 평가 기간

  • 11.19 본선 결과 발표 (16개 팀 선정)

  • 11.19 - 11.25 결선(상위 6개 팀 결선 참여)

  • 11.26 쇼케이스 & 시상식


대회 내용

1. 외부 데이터 및 사전 학습 모델

  • 본 대회에서는 외부 데이터 사용을 권장
  • 외부데이터 사용: 데이터 수집 원천, 수집 코드, 또한 직접 다운로드 시 다운로드 링크 기술 필요
  • 외부데이터 사용 시 2021년 데이터를 사용하지 않도록 유의: Data Leakage에 해당
  • Pre-trained 모델: 사용할 수 있지만 사용한 모델의 아키텍처에 대해 추후 구체적으로 기술 필요

2. 참가 규칙

  • 개인 또는 3인 이하로 구성된 팀(팀 페이지에서 팀 구성 안내 확인)
  • 동일인이 개인 또는 복수팀에 중복하여 등록 불가
  • 단체 혹은 기관 참가 시 별도의 절차가 필요합니다. (More> 공지사항> 게시글 확인)

3. 대회 유의 사항

  • 1일 최대 제출 횟수: 3회
  • 사용 가능 언어: Python, R (R은 사용가능하나 마크다운은 .ipynb로 제출)
  • 데이콘은 부정 제출 행위를 금지하며 데이콘 대회 부정 제출 이력 있을 시 평가 제한 ​ (참조)

​ 이외 자세한 유의 사항은 포스터의 유의 사항을 참고 ​


규칙

1. 평가

  • 대회에 참가하여 데이터를 다운받은 경우 정보보호 서약서 동의가 필요하며, 예선 마감 시점에 파기서약서 동의 필요(법적 책임 부담)
  • 환경 구성, 라이브러리 설치/불러오기, 모델 불러오기, 외부 데이터 크롤링 코드 등 모두 정상적으로 작동이 되는 파일만 채점, 오류 발생 시 평가에서 제외
  • 예선과 본선, 결선으로 진행되며 예선 통과자 선발 후 본선과 결선 진행

2. 코드 및 개발 설명서 제출(예선)

대회 참가자는 아래의 양식에 맞추어 코드와 모델 개발 설명서, 2개의 파일을 코드공유 게시판에 비공개로 2021년 10월 12일 08:00까지 제출

결과물을 제출한 팀 중 Private 점수와 개발 설명서 평가 점수를 합산하여 Top 50팀 선정

  • private 리더보드 평가(비중 80%) / 모델 개발 설명서 평가(비중 20%)
  • 코드에 ‘/data’ 데이터 입/출력 경로 포함
  • 코드/모델 개발 설명서 파일 확장자: .ipynb
  • 코드와 주석 인코딩: UTF-8
  • 모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)
  • 전체 프로세스를 가독성 있게 정리하고 주석을 포함하여 하나의 파일로 제출
  • 개발 환경(OS) 및 라이브러리 버전 기재
  • [개발 설명서]는 코드 공유 게시판 양식 참조

3. 서비스 아이디어 설명서 제출(본선)

평가 내용

예선 평가 종료 후 본선 진출자는 서비스 아이디어 제안서(ppt)를 2021년 11월 08일 08:00까지 제출

예선을 통과한 50팀 중 아래의 평가지표를 통해 Top 16팀 선정

[서비스 제안 평가]

A. 창의성(25%): 아이디어, 차별성, 참신성

B. 과정성(25%): 결과 도출까지의 논리성

C. 적합성(25%): 구현 알고리즘/결과에 대한 해석

D. 정확성(25%, 정량): 알고리즘 오차 점수


4. 최종 발표자료 제출(결선)

평가 내용

본선 평가 종료 후 결선 진출자(Top 6팀)는 최종 발표자료(ppt)를 결선기간 내에 제출

[결선(쇼케이스) 평가 항목 상세]

A. 아이디어 실현 가능성(30%)

  • 아이디어가 실제 실현 가능성이 있는가
  • 아이디어가 비즈니스적 임팩트를 기대할 수 있는가

B. 논리적 일관성(30%)

  • 아이디어 전개 과정에서 탄탄한 자료로 이어져 있는가
  • 근거 있는 자료를 제시하고 적합하게 사용되었는가

C. 내용의 창의성(20%)

  • 주제에 대한 독특한 아이디어와 창의적인 관점이 제시되어 있는가
  • 새로운 발상, 독특한 콘셉트 요소가 있는가

D. 자료의 완결성(10%)

  • 보고서가 성의 있고 짜임새 있게 구성되어 있는가
  • 참가자의 노력이 잘 드러나는가

E. 발표 능력(10%)

  • 발표가 자신감 있고 자연스러운가
  • Q&A에 대한 대응이 매끄럽고, 논리적으로 문제가 없는가

기타 유의사항

자격 유의 사항, 접수 유의 사항, 대회 유의사항

- 자격 유의 사항

  • 21년 08월 23일 기준 대학생 및 대학원 재학생만 참가 가능
  • 대학생: 고등교육법 제2조제1호에서 제6호에 해당하는 학교 (대학, 산업대학, 교육대학, 전문대학, 방송대학, 통신대학, 방송통신대학, 사이버대학, 기술대학)에 2021.08.23. 기준 재학 중인 자
  • 대학원생: 고등교육법 제29조에 따른 대학원 (고등교육법 제30조에 따른 대학원 대학이 두는 대학원 포함)에 2021.08.23. 기준 재학 중인 자
  • 재학생은 재학증명서, 졸업예정증명서 등 졸업 이전에 발급 가능한 문서를 제출할 수 있는 학생을 모두 포함합니다.
  • 참가 신청 이후 졸업시에도 수상 자격을 인정합니다.
  • 대학, 대학원에 재학 중이나, 직장인(급여소득자)은 참가대상에서 제외합니다.

- 접수 유의 사항

  • 대회 참여는 당사 홈페이지를 통해 접수 가능하며 심사결과 안내 및 수상을 위해 연락처를 정확히 기입하여 주시기 바랍니다.
  • 대회 참가 신청시, 개인정보 수집, 이용에 대한 동의여부를 작성해 주시고, 미동의시 공모전 접수가 거부됩니다.

- 대회 유의 사항

  • 경진대회와 관련된 모든 사항은 주관사의 의사결정에 따라 변경될 수 있으며, 변경사항은 공지사항을 통해 공지합니다.
  • 제출한 결과물과 수상작에 대한 저작권은 참가자 본인에게 있으며, 본 경진대회의 취지, 목적 달성 및 홍보를 위해 공개될 수 있고, 필요시 제출 결과물에 관한 저작권을 양수하거나 이용 허락을 받을 수 있습니다. 이 경우에는 저작자와 별도로 약정을 체결하도록 합니다.
  • 제공되는 데이터는 대회 진행을 위한 목적에 한해 사용할 수 있으며, 기타 목적으로 활용이 불가하며 대회 종료 후 파기하여야 함
  • 제3자의 저작권, 특허권, 초상권 등의 모든 지식재산권 및 정보의 무단 사용 등으로 발생하는 법적 문제에 대한 책임은 참가자에게 있으며 추후 문제 발생 시 수상 취소 및 상금 회수, 이후 NH투자증권 경진대회 참여를 제한합니다.
  • 참가 자격 대상이 아닌 경우 수상에서 제외됩니다.
  • 상금의 제세공과금(22%)은 수상자 부담으로, 제세공과금을 제외한 상금을 수상자 명의의 NH투자증권 계좌로 입금됩니다. (팀인 경우, 팀장계좌)
  • 대회기간 종료 후 쇼케이스(시상식) 참석대상자는 쇼케이스(시상식)에 반드시 참석해야 합니다. 단, 주관사에서 인정하는 불가피한 사정이 있는 경우 주관사와의 사전 협의에 의해 수상자가 지정한 대리인이 참석할 수 있습니다.
  • 코로나19 상황에 따라 쇼케이스 추진 방식은 변경될 수 있으며, 이는 사전에 공지하여 안내하도록 합니다.
  • 세부 심사 과정은 공개되지 않으며, 심사 항목 및 배점 등은 일부 변경될 수 있습니다.
  • 대회 문제와 심사기준에 부합되는 결과물이 없을 경우, 해당 부분의 수상자를 선정하지 않을 수도 있습니다.

- 투자 유의 사항

  • 투자자는 금융투자상품에 대하여 금융상품판매업자로부터 충분한 설명을 받을 권리가 있으며, 투자전 상품설명서 및 약관을 반드시 읽어보시기 바랍니다.
  • 금융투자상품은 예금자보호법에 따라 예금보험공사가 보호하지 않습니다.
  • 금융투자상품은 투자원금의 손실이 발생할 수 있으며, 그 손실은 투자자에게 귀속됩니다.
  • 국내주식 매매수수료 약0.084%~0.499%(온라인 매매 기준, 거래금액별/채널별 상이), 비대면계좌 0.01%(모바일증권 기준)발생하며 기타 수수료에 대한 상세내용은 홈페이지 등을 참고하시기 바랍니다.

부정 제출 및 치팅 행위

부정 제출, 조치 방식

1. 부정 제출(행위)

일반적인 대회 규정에 의해서 인간이 예측한 값, 검색 등을 통한 수기 작성 등의 제출, 다른 참가자들과 형평성에 어긋나는 (의도적인)참가 방식 등은 모두 부정 제출로 간주 됩니다. 이러한 행위들은 규정에 의해서 스폰서 및 스폰서로부터 권한을 위임 받은 데이콘이 판단하고 조치하게 됩니다.

우선 인간이 예측한 값, 수기 작성 여부 및 접속 이력 체크 등은 대회 진행 기간 중 꾸준히 이뤄지고 있습니다.

또한 해당 패턴을 관찰하고 추후 기획 및 추가 개발 고려 사항에 반영하고 있습니다.

잠재적인 후보군이 될 경우 데이콘에서 보다 면밀하게 관찰하고 검토하고 있습니다.

대회 중이더라도 의문이 드는 참가자의 소스코드를 요청하여 받고 검증이 되지 않는다면 후보군에서 제외하게 됩니다.

최종적으로는 우승 후보자의 소스코드를 데이콘 및 평가자가 직접 받아서 대회 명세 및 준수사항을 모두 지켰는지, 분석 절차상 문제는 없는지, 분석 절차의 완결성은 얼마나 되는지 등에 대해서 평가를 진행하게 됩니다.

이 과정들을 통해서 부정행위자 및 미완결 코드 제출자는 실격처리 및 최종적인 랭킹에서 순위 변동 혹은 제외가 됩니다.

당연히 데이터 경진대회 우승 이력도 인정되지 않고 활용할 수 없게 되니 선의의 참가자분들께서는 부정 제출 및 부정 행위에 의한 피해는 크게 염려하지 않으셔도 됩니다.

데이콘에서 대회의 신뢰성과 공정성에 특별히 주안점을 두고 대회를 운영하고 있으니 모두 좋은 분석과 향상된 모델 생성에 주력하시고 대회를 편하게 즐기셨으면 하는 바람입니다.


회의

  • 매주 금요일 점심먹고
  • 필요할 때 만나기
  • 노션으로 공유하는고 오땨?!

참고

데이콘: https://dacon.io/competitions/official/235798/overview/description

NH 투자증권: https://www.nhqv.com/

NAMUH 모바일 증권 나무: https://www.mynamuh.com/tx/main.html

About

2021년(제2회) NH투자증권 빅데이터 경진대회 본선 진출

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •  

Languages