Wednesday, 7 February 2018

외환 거래 데이터 마이닝


Forex 전공 전략 데이터 마이닝.


서로 다른 통화 쌍의 고유 한 특성 때문에 많은 양적 외환 전략은 특정 통화 쌍을 염두에두고 고안되었습니다. 이로 인해 많은 수익성있는 거래 전략이 생길 수 있지만 여러 통화 쌍을 통해 거래 될 수있는 전략을 개발하는 것도 이점이 있습니다. 이것은 추가적인 단점을 보완 할 수있는 다양 화 요소를 도입합니다.


다니엘 페르난데즈 (Daniel Fernandez)는 최근 네 가지 외환 전공 과목 각각을 거래 할 수있는 시스템을 발표했습니다. 그의 목표는 EUR / USD, GBP / USD, USD / JPY 및 USD / CHF로 20 년간의 수익성있는 거래 기록을 세웠을 시스템을 찾는 것이 었습니다.


Daniel은 데이터 마이닝 방식을 사용하여 4 개의 Forex 메이저 거래 전략을 개발합니다.


자신의 시스템을 구축하기 위해 Daniel은 데이터 마이닝 소프트웨어를 사용하여 지난 20 년간 4 가지 통화 쌍 각각에 대해 수익성있는 거래 전략을 수립 한 출입국 신호를 정의했습니다. 그가 생각해내는 것은 Forex 메이저 전략의 기초를 형성하는 3 가지 가격 기반 규칙의 조합입니다.


다니엘 & # 8217;의 Forex 메이저 전략.


Daniel의 Forex Majors 전략은 그것이 거래하는 4 가지 통화 쌍 각각에 길고 짧은 지위를 항상 가지고 있다는 점에서 매우 간단합니다. 그것은 모든 거래를 매일 차트에 올려 놓습니다.


이 전략은 다음 세 가지 조건이 충족되면 오래갑니다.


다음 세 가지 조건이 충족되면 전략이 짧아집니다.


보시다시피 전략은 기본적으로 전략에 따라 최적화 된 추세입니다. Daniel은 기사의 시작 부분에서 장기 추세 다음 전략은 일반적으로 여러 시장을 거래하기위한 최상의 전략이라고 언급했기 때문에 이는 의미가 있습니다.


Daniel의 전략이 사용하는 또 하나의 규칙은 ATR 기반 정지 손실입니다. 고정 정지 손실은 20 일 ATR의 180 %로 설정됩니다. 정지 손실이 발생하면 신호는 반대 방향으로 신호가 생성 될 때까지 시장에서 이탈합니다. 테스트 결과 동일한 방향으로 신호를 다시 입력하면 성능에 부정적인 영향을 미침을 나타냅니다.


백 테스팅 성능.


Daniel이 자신의 게시물에 포함시킨 백 테스트 결과에 따르면 전략은 상당히 수익성이있었습니다. 그것은 45 %의 우승 비율, 1.38의 이익 요인 및 1.68의 위험 비율에 대한 보상을 생산했습니다. Daniel의 전략에 대한 가장 큰 우려는 최대 수익 감소 기간이 매우 긴 시간 이었음을 나타냅니다.


Daniel의 수치에 따르면 연평균 수익률은 9.67 %입니다. 이것은 수익성있는 16 년, 잃는 해 4 년 및 기본적으로 균등 한 1 년으로 구성됩니다. 가장 좋은 해는 37.76 %의 수익이었고 최악의 해는 20.2 %의 손실이었습니다.


다니엘은이 시스템이 최대의 인출과 관련하여 수익을 내기 때문에 좋은 독립 실행 형 전략을 대표하지 않을 것이라고 지적합니다. 그러나 그는 더 큰 멀티 시스템 전략의 흥미로운 부분 일 수 있다고 제안합니다.


예, 데이터 마이닝은 Forex 전략에서 매우 유용한 시스템입니다. 이 정보는 제품에 대한 더 많은 정보를 얻는 데 도움이됩니다.


FX 데이터 마이닝 소개.


오늘 가장 흥미로운 분야 중 하나 인 데이터 마이닝에 대해 간단하고 신속하게 소개해 드리겠습니다. 다양한 데이터 마이닝 응용 프로그램이 있습니다. 우리는 FX 거래에서 데이터 마이닝을 통합해야합니다.


FX, FOREX 또는 외국환.


FX는 일일 거래량 측면에서 가장 큰 시장입니다. 그것은 참가자의 세 가지 주요 수준 : 큰 소년, 중급 수준과 당신과 나 같은 간단한 상인이 있습니다. 그것은 투기 적 성격을 가지고 있습니다. 이것은 우리가 상품을 교환하지 않는 대부분의 시간을 의미합니다. 우리는 차이점 만 돌보고 낮은 가격으로 사고 팔고 높게 팔거나 낮은 것을 사고 싶습니다. 짧거나 긴 작업으로 pips를 얻을 수 있습니다. 거래량에 따라 핍 가치는 1 센트에서 10 달러 이상까지 다양합니다. 이것은 외환 시장에서 돈을 버는 주요 방법입니다 (Carry Trade, Brokering, Arbitrage 등과 함께). 외환 시장은 거대하지만 모든 수준의 플레이어에게 적합합니다. 외환 시장을 제품과 고객이 무한대 인 무한한 슈퍼마켓이라고 생각해도 무한한 숫자의 계산원이 있습니다. 모든 사람에게 동등한 기회가 있음을 의미합니다.


데이터 마이닝 및 기계 학습.


데이터 마이닝은 컴퓨터 과학의 성숙한 하위 분야입니다. 엄청난 양의 데이터로부터 유용한 지식을 추출하는 데는 많은 데이터가 포함됩니다. 기계 학습 알고리즘을 사용하여 지능형 데이터 처리를 수행합니다. 데이터 마이닝은 CRUD (작성, 읽기, 업데이트 및 삭제)만이 아닙니다. 우리는 여러 가지 데이터 마이닝 방법을 가지고 있습니다. 이로써 방법 및 일부 응용 프로그램.


분류 - 스팸으로 분류하여 거래를 사기로 분류합니다. 협회 - YouTube는 YouTube의 역사를 바탕으로 새로운 동영상을 제안합니다. Amazon은 체크 아웃 중에 더 많은 항목을 제안합니다. 클러스터링 - 일반 그룹을 찾기 위해 경제 뉴스 및 의견과 같은 비정형 데이터 분석. 프로세스 마이닝 - 비효율적 인 작업을 찾기 위해 호출 운영자의 로그를 검사합니다. 텍스트 마이닝 - 패턴 인식을위한 광업 뉴스 또는 기술적 분석.


알고리즘 트레이딩은 거래 알고리즘의 자동 실행입니다. 우리의 경우 거래 알고리즘은 광산에서 발생합니다. 자동화 된 거래는 프로그래밍 언어의 일부 왕이 수행합니다. 속도와 견고성은 여기서 중요한 포인트입니다. 인간 상인은 그러한 특성에 관한 컴퓨터 프로그램을 이길 수 없습니다. HFT (High Frequency Trading) 및 저수준 프로그래밍 (C ++) 또는 장기 트레이딩 및 고급 프로그래밍 (Java)이 될 수 있습니다.


데이터 마이닝과 알고리즘 거래를 혼합합니다.


알고리즘 거래에서 데이터 마이닝을 혼합하는 것이 중요합니다. 가장 중요한 것은 데이터입니다. 간단한 원칙에 따르면 데이터가 충분하지 않으면 모델이 충분하지 않을 수 있습니다 (GIGO). 모델 만들기, 구현 및 테스트 (항상 그렇듯이)에 관한 것입니다. 현재이 흐름은 대부분 수동입니다.


데이터 마이닝 분야에는 많은 오픈 소스 소프트웨어 옵션이 있습니다. WEKA는 뉴질랜드 해밀턴 대학 (University of Waikato)에서 시작된 데이터 마이닝 프레임 워크입니다. WEKA는 Java로 작성되었으며 훌륭한 API를 가지고있다. 또한 잘 알려진 대부분의 기계 학습 알고리즘에 대한 구현이 있습니다.


훌륭한 도구의 혼합이 중요합니다. 가능한 거래 모델이 너무 많습니다. 동전 던지기는 어리석은 거래 시스템이지만 거래 시스템입니다. 금을 찾으려면 데이터 마이닝이 필요합니다. 좋은 도구는 광산업에 아주 좋은 행운을 얻습니다.


투자자를위한 데이터 마이닝.


어떤 금융 교육 담당자라도 정보에 근거한 투자자의 중요성에 대해 알려줄 것입니다. 투자자는 주식과 채권의 다른 특성과이를 발행하는 회사의 특성을 이해해야합니다. 그러나 무시당하는 것 중 하나는 연구를 수행 할 데이터를 얻을 수있는 곳입니다. 결국 회사의 수입이 실제로 무엇인지 알 수 없다면 회사의 수입을 평가하는 방법을 이해하는 것이 무엇이 좋은 일인가?


아마도 가장 유용한 정보원 인 기업 신고서는 투자자들에게 기업의 재무 건전성, 미래 전망 및 과거 성과를 설명하는 정보를 제공합니다. 이것은 특정 주식, 채권 또는 뮤추얼 펀드가 현명한 투자인지 여부를 판단하는 데 필요한 정보입니다. 뮤추얼 펀드의 경우, 이 서류는 지난 분기의 펀드 수익률, 펀드의 비용 및 포트폴리오 보유액을 알려줍니다. 주식 및 채권을 구입할 때 연구해야하는 회사의 경우 재무 건전성 및 향후 전망에 대해 자세히 설명하는 회사의 대차 대조표를 통해 제출됩니다.


신중한 분석을 통해 회사는 현재 어디에서 어떻게 돈을 지출하고 있는지, 수익을 창출하는 데 얼마나 효율적인 관리가 있는지, 회사의 미래 전망에 긍정적 인 영향을 주는지 확인할 수 있습니다. 이러한 보고서 중 많은 부분이 가장 흥미롭지는 않지만 이해하기 어려운 경우도 있지만, 모든 다른 투자자가 사용할 수있는 풍부한 정보를 제공합니다. (기업 분석에 대한 정보는 기본 분석 및 비율 분석 자습서를 참조하십시오.)


SEC 규정에 따르면 자산 1,000 만 달러 이상 주주 500 명 이상이거나 나스닥 및 뉴욕 증권 거래소 (NYSE)와 같은 미국 거래소에 상장 된 회사는 공시를 위해 공식 문서를 제출해야합니다. 그러나이 규정은 모든 회사에 적용되는 것은 아니므로 회사가 작을수록 좋은 정보를 추적하는 것이 어려워집니다. 일부 중소기업은 대기업에 필요한 서류를 작성하기로했지만 다른 회사는 그렇지 않습니다.


전자 데이터 수집, 분석 및 검색 시스템의 약자로, 이 서비스는 여러 회사가 제출 한 규제 관련 서류를 자동으로 수집하고 전달합니다. SEC가 상장 기업에 요구하는 가장 중요한 규제 서류는 지난 해 회사의 성과를 요약 한 연간 10-K 양식입니다. 10-k는 SEC 표준을 준수해야하며 일반적으로 회사의 연례 보고서보다 포괄적입니다. 뮤추얼 펀드의 경우 EDGAR는 모든 사업 설명서를 온라인으로 제공하므로 펀드의 포트폴리오, 펀드가 청구 할 수있는 최대 비용 비율 및 펀드 관리가받는 보상 종류까지 보유 할 수 있습니다. (SEC 자료에 자세히 설명되어 있습니다 : 필요한 양식)


SEC는 sec. gov/edgar. shtml에서 EDGAR에 무료로 액세스 할 수 있지만 불행히도 EDGAR는 사용자에게 친숙하지 않습니다. 정보를 찾는 것이 어려우며 일반 텍스트 형식을 사용하면됩니다. 정보는 모두 거기에 있지만, 당신은 정말로 가치있는 것을 얻기 위해 발굴해야합니다. 다행히도 EDGAR 데이터에 액세스하는 더 나은 방법을 제공하는 다른 사이트가 있지만 단점은 일반적으로 구독료를 부과한다는 것입니다.


요즘 웹 사이트가없는 회사는 시간을 할애 할 가치가 없습니다. 가장 낡았 던 "오래된 경제"회사의 대부분조차도 웹 사이트를 가지고 있습니다. 회사 웹 사이트에서 "투자자 관계"링크를 찾을 때. 다운로드 가능한 연례 보고서, 재무 제표, 주식 정보, 회사 뉴스 등을 자주 볼 수 있습니다.


매년 회사는 1 주 또는 10,000 주를 소유하고 있는지 여부와 상관없이 각 주주에게 연례 보고서를 발송해야합니다. 주주가 아니며 보고서를 하드 카피 형식으로 읽으려면 보통 회사에서 무료로 직접 주문할 수 있습니다. 큰 회사는 이러한 보고서를 마케팅 도구로 사용하기를 원합니다. 일부 제 3 자 회사는 또한 공개 회사에 대한 무료 연례 보고서를 제공하지 않고 사업을합니다. (회사 수 분석에 대한 자세한 내용은 트레이더를위한 기본 분석을 참조하십시오.)


투자 결정에 상관없이 정확한 금액을 조사하는 것이 중요하므로 돈을 어디에 두는 지 정확히 알 수 있습니다. 무료로 제공되는지 여부에 관계없이 이와 같은 풍부한 정보가 제공되므로 투자자가 정보가없는 결정을 내릴 이유는 없습니다.


무역 전략 데이터 마이닝.


아마 아무 말도하지 않을거야.


내 추천은 관심있는 주제에 대한 많은 정보가있는 사이트로 이동하는 것입니다.


미안하지만 지금은 토론에 참여할 수 없습니다. 매우 바쁩니다. 나는 돌아올거야 - 그 문제에 대한 내 의견을 분명히해라.


좋은 좋은 좋은 일을 계속.


수학적으로 거래 전략을 암호화하는 법.


다양한 계량 경제학 데이터 (예 : 인덱스, FX, 상품, 금리)가있는 경우 데이터에 관계가 있는지 확인하기 위해 수식을 찾을 수 있습니다. e. 지. 이 발견 된 패턴으로 예측할 수 있습니다.


제가 여기서 묻는 것은 약간 다릅니다 : 주어진 형태가 길거나 짧을 때 어떤 지표가 발견되는 거래 전략을 나타내는 수식 f ()를 검색 할 수있는 또 다른 방법이 있습니까? 파생 상품 조합)? 아이디어는 공식 자체가 지표 / 거래 전략의 n 차원 공간에 살며 가능한 한 최선을 다해 살아 가려고합니다.


이는 인공 주식 시장을 시뮬레이션하는 다중 에이전트 시스템의 표준 절차 여야합니다. 슬프게도, 나는 그것을하기위한 간단한 접근법을 찾을 수 없습니다.


지난 수십 년 동안 컴퓨터 기술의 급속한 발전으로 투자 전문가 (및 아마추어)는 방대한 양의 재무 데이터에 액세스하여 분석 할 수있었습니다. 또한 월드 와이드 웹, 게시판을 통해 전 세계 사람들이이 정보에 신속하게 액세스 할 수있을뿐만 아니라 개인이 의견을 말하고 상호 작용할 수있는 방법을 제공 할 수 있습니다. 결과적으로 최근 흥미로운 논쟁 주제 중 일부는 "데이터 마이닝 (data mining)"의 관행과 결과를 중심으로 진행되었습니다.


데이터 마이닝은 우연히 또는 임의의 조건으로 발생할 것으로 예상되는 결과와 다른 상관 관계 및 패턴을 데이터베이스를 통해 검색하는 작업을 포함합니다. 데이터 마이닝의 실행 자체는 좋지도 좋지도 않으며 데이터 마이닝의 사용은 많은 산업에서 보편화되고 있습니다. 예를 들어, 평균 수명을 향상시키기 위해 연구자는 데이터 마이닝을 사용하여 사망 원인과 원인을 분석 할 수 있습니다. 데이터 마이닝은 광고주 및 마케팅 회사가 소비자를 타겟팅하는 데에도 사용됩니다. 그러나 아마도 가장 유명한 데이터 마이너 그룹은 미래 주식 가격 움직임을 예측하고자하는 주식 시장 연구원이다. 대부분의 경우는 아니지만 대부분의 주식 시장 예외는 과거 가격 및 관련 (때로는 관련이없는) 변수의 데이터 마이닝을 통해 발견 (또는 적어도 문서화)되었습니다.


시장 조사 전략이 데이터 마이닝을 통해 발견되면 다시 테스트 한 전략에서 미래의 실제 상황에 성공적으로 투자 할 때 잠재적 인 문제가 많이 있습니다. 첫 번째 문제는 관계가 무작위로 발생했을 확률을 결정하거나 예외가 테스트 된 특정 샘플에만 적용될 수 있는지 여부를 결정하는 것입니다. 통계학자는 데이터를 충분히 길게 고문하면 무엇이든 고백 할 것이라고 지적합니다.


David Leinweber는 S & P 500과 무작위 상관 관계를 찾고자했습니다. 피터 코이 (Peter Coy)는 Leinweber의 조사 결과를 비즈니스 위크 (Business Week)의 기사에서 "데이터를 채굴하는 사람은 바보의 금을 칠 수 있습니다"라고 설명했습니다 (6/16/97). 기사는 데이터 마이닝, 마이클 Drosnin†™ s 책 성서 부호를 토론했다. 특히 많은 요소를 고려할 때 순수한 우연에 의해 데이터에서 패턴이 발생할 것이라는 사실을 말합니다. 데이터 마이닝의 많은 경우 통계적 검증 또는 반박의 영향을받지 않습니다. 린 웨이버 (Leinweber)는 데이터 마이닝의 함정을 설명하면서 "유엔 CD-ROM을 샅샅이 뒤져서 역사적으로 스탠다드 푸어스 500 지수의 가장 좋은 예측 변수는 방글라데시의 버터 생산량이라는 것을 발견했다"고 말했다. Coy에 따라 배우는 교훈은 "과거의 데이터에 맞게 발생하는 수식은 반드시 예측 가치가있는 것은 아닙니다."


백 테스트는 항상 의심스러운 정보 클래스였습니다. 당신이 거꾸로 보면, 당신은 좋은 것을 보여줄 것입니다.


데이터 마이닝을 통해 발견 된 예외는 시간이 증가하고 서로 다른 기간 (예 : 외환 거래)의 샘플 테스트에서 확인할 수있는 경우 더 중요하다고 간주됩니다. 백 테스트에서 이상이 발견되면 비용 (거래 비용, 입찰 심리 스프레드, 기관 트레이더 비용 영향)을 결정하는 것이 중요합니다. 일부 예외는 단순히 실현 될 수 없습니다. 이 항목에 대한 자세한 내용은 가치 라인 변형 및 구현 부족을 참조하십시오. 또한 과거에 효과가 있었던 전략은 더 많은 투자자들이 전략에 따라 투자하기 시작하면 작업을 멈출 수 있습니다. 이 주제에 대한 자세한 내용은 효율적인 시장 가설을 참조하십시오.


Motley Fool은 개인 투자자에게 교육 조언을 제공 한 것에 대해 많은 사람들로부터 칭찬을 받았습니다 (예 : Motley Fool은 주식 매매 및 주식 보유자와 분석가의 관심사 충돌에주의하고 투자자에게주의를 권고하는 데있어 건전한 권장 사항을 제공합니다. 비현실적인 성능 주장의). 그러나 Motley Fool†™ s "어리석은 4"주식 전략 및 그것의 근본적인 이유는 비판을 당겼다.


1997 년 BYU 교수 인 그랜트 맥퀸 (Grant McQueen)과 스티븐 토리 (Steven Thorley)는 다우 전략 (Dow Strategy, Abstract)의 대단히 인기있는 Dogs에 질문 한 Financial Analysts Journal (FAJ)의 한 논문을 코 나타났습니다. Dow Dogs를 분석하기 위해 이미 데이터를 수집 한 교수진은 Motley Fool†™ s Foolish Four에서 데이터 마이닝에 대한 사례 연구를 수행했습니다. McQueen과 Thorley는 The Motley Fool Investment Guide (MFIG)에 설명 된대로 Foolish Four를 분석했으나 Foolish Four에 대해서는 실제로 여러 가지 변형이 있습니다 (Foolish Four 설명 및 Foolish Four History 참조). 그 연구 결과는 Financial Analysts Journal의 "Mining Fool 's Gold"라는 제목의 1999 년 3 월 / 4 월호에 실 렸습니다. Fool의 재미 있고 창의적인 작문 스타일의 정신으로 교수들은 BYU 서버에 Wordperfect의 "lighthearted"버전의 종이를 게시했습니다. 연구에 사용 된 데이터는 여기에서 다운로드 할 수 있습니다.


McQueen과 Thorley는 데이터 마이닝의 잠재적 인 함정에 대해 자세히 설명하고 Foolish Four에서 샘플 테스트를 수행했습니다. 교수는 거래 규칙의 복잡성, 일관된 스토리 또는 이론의 부재, 샘플 외 테스트의 수행 및 위험, 거래 비용 및 세금 반환 조정을 통해 데이터 마이닝을 탐지 할 수 있다고 판단합니다. 게다가 그들은 Foolish Four와 Dow Ten 거래 규정이 연초에 주가에 영향을 줄만큼 인기가 있다고 주장합니다.


Motley Fool은 1999 년 아카이브에서 액세스 할 수있는 Foolish Four 포트폴리오 보고서에서 FAJ 논문에 대한 강한 반응을 보였습니다. 5/10 일자 보고서를 참조하십시오. 5/11. 5/12. 5/13. 5/14. 5/17. 5/18. 5/19. 5/20. 5/21. 이 답변에는 FAJ 논문에 대한 몇 가지 반론과이 논문에서 논의 된 유효한 문제에 대한 인정이 포함됩니다.


많은 이슈들이 논쟁의 여지가 있지만, 실제 산성 테스트와 FAJ 논문의 비판적 발견은 1949 년에서 1972 년 사이의 Foolish Four 수익에 대한 샘플 테스트에서 벗어났습니다. 그 기간 동안 Foolish Four는 Dow 30을 평균 0.32 % / 년. 그 기간 동안 Dow Dogs의 실적이 저조했을뿐만 아니라 거래 비용과 위험을 감안한 후에도 DJIA에 비해 다소 지연되었을 것입니다. 이 중요한 문제는 5/14 일자 보고서에서 간략하게 논의되었습니다.


이 문제를 관점에서 살펴보면 1973 년 초 투자가가 지난 24 년 동안의 DJIA 실적을 돌아 보았을 때를 생각해보십시오. 투자자가 그 당시에 어리석은 포 (Foolish Four)가 시장 수익률을 앞당길 수 있다는 것을 어떻게 알았는지 합리화하는 것은 어렵습니다.


다른 샘플 테스트에서 McQueen과 Thorley는 MFIG에서 논의 된 1973-1996 년 기간을 사용했지만, 1 월보다는 재조정을 위해 7 월을 사용했습니다. 이러한 조건 하에서 Foolish Four의 수익률은 평균 1 년당 2.95 %의 DJIA를 이겼으며 1 월의 재조정을 포함한 DJIA 대비 12.23 %의 이점보다 훨씬 낮습니다.


Fools를 보호하기 위해 MFIG와 웹 사이트에서 여러 가지 공개가 이루어졌습니다. 98 년 8 월 7 일자 Foolish Four 보고서에 실렸다. 그들은 1 월 이외의 달에 재조정이 일어 났을 때 수익률이 더 낮았다는 것을 공개했다. 또한 MFIG에서 20 년 동안의 25.5 % 수익률 수치가 여러 번 사용되었지만 적어도 1961 년 수치를 조사한 사실을 언급하고 더 긴 기간 동안 수익률은 18.35 %로 떨어졌습니다. 반면에, 더 긴 시간이 연구되었다고 밝혀지면, 더 짧은 기간의 수를 계속 언급하고 그 데이터를 근거로 논쟁을하는 것은 의심스러운 것으로 간주 될 수 있습니다. 장기간 결과를 공개하고 집중하는 것은 데이터 광부의 주장의 신뢰성을 높이는 경향이 있습니다.


Jason Zweig는 Foolish Four에 대한 자신의 견해를 표명하고 Money Magazine (1999 년 8 월)의 False Profits에서 "Very Stupid"및 "Extra Dumb"포트폴리오를 채취 한 자신의 데이터를 공유합니다. Morningstar 웹 사이트에서 Just Reinenthaler의 의견을 Just foolin†™에서 읽었을뿐만 아니라 투자 고문 William Bernstein의 기사를 Mined : All Mined (James O'Shaughnessy의 답변 및 후속 토론 참조)라는 제목의 기사에서 읽을 수 있습니다. .


2000 년 12 월에 The Motley Fool은 그들이 만든 "Foolish Four"주식 전략을 더 이상지지하지 않겠다고 발표했습니다. Foolish의 이론적 근거가 더 이상 웹 사이트와 서적을 통해 수년간 선전 한 전략을 추천하지 않기 때문에 Foolish Four를 다시 생각해보십시오.


다른 데이터 마이닝 토론으로 이동, 윌리엄 브록. Josef Lakonishok. Blake LeBaron (BLL)은 Journal of Finance 저널의 12 월호에 "간단한 기술 거래 규칙 및 주식 수익의 확률 적 속성"이라는 기사를 실었습니다. 이 연구는 기술 분석에 기반한 성공적인 거래 전략을 문서화 한 몇 안되는 학술 논문 중 하나입니다 (기사 전체에 대한 기술적 인 예외 사항 참조). 교수들은 1897 년에서 1986 년까지의 다우 존스 산업 평균에 비해 이동 평균 및 지원 및 저항 도구 모두 예측 가치가 있음을 입증했습니다.


Data-Snooping, Technical Trading Rule Performance 및 Bootstrap은 BLL 용지를 다시 검토하고 1999 년 Journal of Finance 저널에 실립니다. 이 기사에서 Ryan Sullivan, Allan Timmermann 및 Halbert White (STW)는 BLL 결과에 대한 데이터 스누핑의 효과를 확인하려고합니다. 그들은 또한 샘플 테스트를 제공하기 위해 원래의 연구 (BLL 데이터는 1986 년까지) 이후의 기간에서 수집 된 데이터를 사용합니다. 최근 연도를 추가하면 100 년 동안의 데이터를 제공 할 수있었습니다. STW는 전체 기간 동안 가장 실적이 좋은 거래 규칙에 대해 거래 당 0.27 %의 손익 거래 비용 수준을 계산했습니다.


원래의 BLL 데이터는 거의 90 년이라는 매우 긴 기간을 다루었 기 때문에 샘플 테스트를 통과해도 전략이 잘 수행 될 것으로 기대할 수 있습니다. 그러나이 연구의 결론은 효율적인 시장 가설의 또 다른 잠재적 인 예가 될 수있다. STW는 BLL의 결과가 데이터 스누핑에 강건한 것으로 나타 났지만, 1987-1996 년을 대상으로 한 샘플 밖의 실험에서 최고의 거래 규칙의 우수한 성과가 반복되지 않는다는 사실을 발견했다. " "기술 거래 규정이 1987-1996 년 동안 경제적 가치가 있다는 증거는 거의 없다." 이것은 주식 시장의 데이터 광부와 적극적인 투자자에게 또 하나의 경고를 제공 할 수 있습니다. 비록 오랜 시간 동안 과거에 이상 현상이 있었고 결과가 데이터 스누핑의 함정으로 고통받지 않는 것처럼 보이더라도 변칙이 발견되면 앞으로는 계속 작동하지 않을 수 있습니다.


합리적인 사람들은 윤리적 또는 신앙의 문제가되지 않고 합리적인 의견 차이를 가질 수 있습니다.


다우 존스 자산 관리 (Dow Jones Asset Management, 5-6 / 99)의 경보 효율성 (RR)은 데이터 마이닝과 "과핑 (overfitting)"문제를 다루는 흥미로운 기사입니다. 데이비드 쇼 (David Shaw) 투자 산업 재향 군인의 의견도 포함됩니다. 테드 애런슨. 및 로버트 Arnott. 이 기사는 한정된 양의 과거 데이터와 무한한 수의 복잡한 모델을 제공하는 경우 정보가없는 투자자가 데이터를 "지나치게"매료시킬 수 있다고 주장합니다. 체계적이라고 가정되는 패턴은 실제로 샘플 특정 일 수 있으며 따라서 가치가 없습니다.


사람들은 매우 큰 초과 수익을내는 거래 전략으로 항상 우리에게 다가옵니다. 그러나 사람들이 표준 수학 도구를 사용하고 엄청난 양의 데이터를 훑어 냄으로써 발견하는 대다수의 것들은 통계적 인공물입니다.


Aronson은 시장이 "거의 완전히 효율적"이며 "당신이 다른 사람을 시간의 51 % 또는 52 % 이상 능가한다고 생각하면 스스로 속이고 있다고 주장합니다." Aronson은 시장 비효율을 찾는 투자자들이 이러한 이변에서 거래 비용과 동등한 이익을 얻을 수있는 잠재력을 감소 시켰다고 믿습니다. 그렇다면 거래 비용을 최소화하는 것이 시장을 이기려는 시도에서 중요합니다.


그렇다면 샘플 테스트에서 확인 된 예외가 있습니까? 곧 나올 금융 저널 기사, James L. Davis, Eugene F. Fama. Kenneth R. French는 대답이 확실한 것이라고 주장합니다. 낮은 가격의 장부가 비율을 가진 회사는 실적이 우수하며 패턴은 미국 및 해외 시장에서 문서화되었습니다. 특성, 공분산 및 평균 수익률 : 1929 년에서 1997 년까지 저자들은 1929 년부터 1963 년까지 장부가 가치에 대한 낮은 가격의 수익률을 문서화하는 데 큰 걸음을 내딛었습니다. 초기 기간 동안 가치 프리미엄은 훨씬 컸습니다 (50 % 월)보다 최근의 1963 년 7 월 ~ 1997 년 6 월 기간 (월 43 %)보다 많습니다.


궁극적으로 앞으로 어떤 전략이 성과를 낼 것인지 확실히 알 수 있습니까? 이 질문에 대한 의견은 분명히 다르지만 표준 면책 조항은 항상 적용됩니다. 과거 성과는 미래 성과를 보장하지 않습니다.


추가적인 수학적 논의가 Cherry Picking에 포함됩니다. 주식 시장 사기. 및 동전 뒤집기 페이지.


제안이나 의견을 Investor Home에 보내주십시오.


마지막 업데이트 2001 년 2 월 12 일. 2001 년 투자자 홈. 판권 소유. 부인 성명.


저는 통계 및 재무 컨설팅 분야의 전문적인 서비스를 제공합니다. 스탠포드 대학에서 통계학 박사 학위와 재무 담당 박사 학위를 받았습니다. 저는 데이터 마이닝, 요인 분석, 클러스터 분석, 시계열 분석, 확률 적 변동성 모델링 / 자산 가격 책정, 독점적 거래 전략의 통계적 재정 거래 / 개발 등과 관련된 프로젝트에 초점을 맞추어 4 년간 업계에서 근무했습니다.


마찬가지로 중요한 것은 6 년간의 재무 및 통계 컨설팅 경험이 있습니다. 저는 마케팅, 의학, 생물학, 심리학, 사회학, 정치학, 교육, 컴퓨터 과학 및 금융 분야의 기업, 비즈니스 전문가, 연구원 및 학생들과 상담했습니다. 위치 기반으로 내 고객은 뉴욕, 보스턴, 필라델피아, 워싱턴, 로스 앤젤레스, 샌프란시스코, 산호세, 스탠포드, 시애틀, 시카고, 토론토, 몬트리올, 런던, 에딘버러, 베르겐, 프랑크푸르트, 쿠웨이트 시티, 홍콩 홍콩, 애들레이드, 멜버른, 시드니 등.


일반적으로 맨해튼에서 만나거나 고객이 뉴욕에서 멀리 떨어져 있으면 Skype, 전자 메일 및 전화를 통해 문의합니다. 그 외에도, 고객을위한 프로젝트를 완료합니다. 회의가 필요할 수도 있고하지 않을 수도 있습니다. 서비스의 예 : 주요 통계 패키지 (R, Matlab, SAS, SPSS, Stata)의 데이터 분석, 실험 설계, 가격 및 거래 시스템 개발, 논문 지원, 일반적인 지식 향상을위한 컨설팅 세션. 서비스 유형에 대한 자세한 설명을 읽으십시오. 경험. 사례 연구 및 지불 옵션.


긴급 성이 포함되어 있지 않으면 표준 프로젝트 (회귀 분석, ANOVA, 조사 설계, 비모수형 테스트) 및 하이테크 자료 (데이터 마이닝, 클러스터 분석, 패널 데이터, 다 변수 시계열, 숨겨진 마르코프 모델 , Markov Chain Monte Carlo, 베이지안 모델링, GWAS, SAS 기능, 통계적 재정 거래 / 거래 전략, 이색 자산 가격 결정, 시장 위험 관리). 자세한 가격 정보 또는 기타 설명을 원하시면 저에게 이메일을 보내주십시오.

No comments:

Post a Comment