重回帰分析

重回帰分析を簡単に言うといろいろな原因とその結果を結びつける多変量解析になります。

例えば結果として明日の値動きは陽線で引けるかもしくは陰線で引けるかは、原因としての様々なテクニカル指標との因果関係を分析してみることなどが挙げられます。この原因が売買システムにおけるロジックとして、明日の値動きにどう繁栄されるかなどを検証すれば、有効なシステムロジックが見つかるかもしれません。

ここでは簡単な仕掛けサインとの因果関係を調べる重回帰分析の例を掲載しておきます。

重回帰分析はいくつかの原因をＸ1、Ｘ2、Ｘ3・・・としてその結果Ｙとした場合次のような関係式を作ります。

この式を重回帰式と呼び、Ｘ1、Ｘ2、Ｘ3・・・を説明変数、Ｙ^を目的変数などと呼ばれ、各説明変数の係数b1、b2、b3・・・は偏回帰係数と呼ばれます。b0は定数項になります。

実際の分析の流れは以下のようになります。

①重回帰分析をする意味があるのか各説明変数と目的変数の散布図を描いてみる。

②重回帰式を求める。

③重回帰式の精度を確認する。

④重回帰式と偏回帰係数の検定を行う。

⑤母回帰式を推定、予測する。

では具体的な例で重回帰分析を実行してみましょう。

分析に使用するデータとしてＥＵＲ/ＪＰＹ×２とＣＨＦ/ＪＰＹ×３の週間サヤデータ、２０００年１月から２００９年１２月分を使用します。

　　ＥＵＲ/ＪＰＹ×２-ＣＨＦ/ＪＰＹ×３　サヤグラフ

それでは上の流れのとおり順番に分析を行います。

①重回帰分析をする意味があるのか各説明変数と目的変数の散布図を描いてみる。

まず始めに変数の設定を行います。ここでは次のように目的変数と説明変数の定めます。

週間サヤ変動値　　　　　　　　　　　　　　　　　　　　　　　　⇒　目的変数”Ｙ”

１つ前の週間サヤ変動値　　　　　　　　　　　　　　　　　　　⇒　説明変数”Ｘ1”、

サヤの標準偏差（１５週）に歪度（１５週）を掛けた値（※）　⇒　説明変数”Ｘ2”と設定します。

※なぜこのような処置をするのかというと標準偏差は必ず正の値を取りますのでプラスマイナス両方を取るサヤの変動値Ｙと回帰分析を行う場合、１次式で当てはめることが出来ないためです。またバラツキにひずみの尺度を合わせることによってサヤの変動が大きくかつサヤの分布が正規分布になってない状態を図る尺度として使えるのではないかという思惑もあります。

説明変数Ｘ1とＸ2と目的変数Ｙについての散布図はそれぞれ以下のようになります。

散布図を見てもわかりますが、Ｘ1とＹの関係には若干負の相関ありそうです。これは前の週サヤが拡大に動いた場合はその翌週は縮小に、逆に前の週サヤが縮小に動いた場合はその翌週は拡大に動く傾向があることを意味しています。

次にＸ2とＹの関係を見てみますこれには全く相関がなさそうですが、Ｘ１とＸ２の関係には少し正の相関があることが気にかかります。

以上からＸ1、Ｘ2、Ｙにはなんらかの関係があると思われますで、重回帰分析をしてみる価値があるのではと判断します。

②重回帰式を求める。

実測値Ｙと予測値Ｙ＾の差の平方和を残差平方和と呼びＳeで表します。

重回帰式はこの残差平方和Ｓeを最小にする基準によって求められます。

すなわち上の式が最小になるようなｂ0～ｂｐまでの回帰係数を求めればよいわけですから、各回帰係数を偏微分して０と置く最小２乗法で求めればよいことがわかります。

上の連立方程式を解いてｂ0～ｂｐまでの回帰係数を求めれば重回帰式が定まります。

実際に本例で求めた重回帰式は以下のようになりました。

　　Ｙ^ = -0.159X1 + 0.027X2 - 0.017

③重回帰式の精度を確認する。

求めた重回帰式

　　Ｙ^ = -0.159X1 + 0.027X2 - 0.017

はどの程度実際のデータに当てはまっているか、その当てはまりの良さを表すのに決定係数という尺度が使われます。

決定係数を求めるあたって以下の統計量を求めます。

実測値Ｙの偏差平方和　　Ｓt

予測値Ｙ＾の偏差平方和　　Ｓr

実測値Ｙと予測値Ｙ＾の差の平方和すなわち残差平方和　　Ｓe

さらにこの３つ平方和に以下のような関係式が成立しています。

　　Ｓt = Ｓr + Ｓe

このことから当てはまり表すを尺度は実測値Ｙの偏差平方和Ｓtの情報量の中に予測値Ｙ＾の偏差平方和Ｓrの情報量がどれだけ含まれているかみればよいことがわかります。これを比率で表した尺度が決定係数（Ｒ＾2）になります。

また決定係数”Ｒ＾2”は実測値Ｙと予測値Ｙ＾の相関係数の２乗と等しくなります。それゆえにこの”Ｒ”は重相関係数と呼ばれています。どちらも当てはまりの良さを表す尺度として使われています。

本例で求めた決定係数及び重相関係数は以下のようになりました。

　　決定係数　Ｒ＾2 = 0.025 、重相関係数　Ｒ = 0.157　

一般的に１つの目安として決定係数は0.5以上、重相関係数は0.7以上あれば当てはまりがよいとされてますが、今回の結果をみれば全然値が小さく予測式が当てはまってないと解釈できます。そもそも売買ロジックにそれほど精度の高い予測式が存在するはずがないのが当たり前です。私もこのような分析を数多くやってきましたが重相関係数が0.2を超えることは稀です。ですが実際のシステム売買において若干でも相関があれば、それが強力なロジックが存在することを説明している場合もあります。個人的には重相関係数0.2付近（逆相関の場合は-0.2）を目安としております。

④重回帰式と偏回帰係数の検定を行う。

求めた重回帰式が予測に役立つかどうか調べるために以下のような検定を行います。

検定には母集団上のモデルとして次のような重回帰モデルを設定します。

　　　　　 ”ε”は誤差を表します

このモデルに対して仮説を立て検定を行います。

■重回帰式の検定

　仮説　Ｈ0 ： β1＝β2＝０

これは回帰係数β1とβ2が０であれば予測することができないという仮説になります。

この検定には次のような分散分析表を使います。本例で計算した分散分析表を掲載します。

この表は全データ数”n”の変動の全体Ｔが回帰Ｒの部分と残差Ｅの部分に分けられる変動因を分析します。

自由度ｆは各変動因から独立に選べるデータ数で次のように計算されます。

ｆT = n-1

fR = p （pは説明変数の数）

fE = n-p-1

平方和Ｓはそれぞれ以下の値をとります

　Ｓt　実測値Ｙの偏差平方和　　

　Ｓr　予測値Ｙ＾の偏差平方和　　

　Ｓe　残差平方和　　

分散Ｖはそれぞれ平方和Ｓを自由度ｆで割った値になります。

分散比Ｆ0は回帰の分散ＶＲを残差の分散ＶＥで割った値になります。

２つの分散比はＦ分布をすることになりますので、検定ではこの分散比Ｆ0の値を使用します。仮説が正しくなければＶＲがＶＥよりも小さくなることはないので、これの有意水準を検定すればよいことになります。

Ｆ値は自由度fR、fE 、と有意水準αで決定しますので

Ｆ0＞Ｆ（fR、fE 、α）であればαの有意水準で仮説か棄却されることになります。

上の表の検定では有意水準αが５％で棄却されれば「*」でマークして、有意水準αが１％で棄却されれば「**」でマークするようにしております。

本例では有意水準１％で仮説が棄却されてますので、求めた重回帰式は予測に役立つと判断できます。

■回帰係数の検定

個々の回帰係数の検定では以下のような仮説を立てます。

　仮説　Ｈ0 ： β1＝０　（前週のサヤ変動は翌週のサヤの変動に影響しない）

　仮説　Ｈ0 ： β2＝０　（サヤの標準偏差*歪度は翌週のサヤの変動に影響しない）

次の統計量をもとめてｔ分布による検定を行います。

標準誤差とは推定値の標準偏差のことで以下のような式で求まります。

説明変数の標準誤差

定数項（切片）の標準誤差

回帰係数を標準誤差で割ってｔ値を求め有意性の検定を行います。

ｔ0＞ｔ（n-p-1、α）であればαの有意水準で仮説か棄却されることになります。

回帰係数ｂ１は有意水準１％で仮説が棄却されてますので、重回帰式は含ませることがよいと判断することができます。

回帰係数ｂ２は有意ではありませんので、重回帰式は含ませなくても影響はないと判断することもできます。

定数項の検定については有意ではありませんが、この値はただ回帰式の当てはめをよくするためのものですからあまり重要視する必要はないかと思われます。

⑤母回帰式を推定、予測する。

説明変数（Ｘ1、Ｘ2、・・・Ｘｐ）が任意の値（Ｘ10、Ｘ20、・・・Ｘｐ0）をとるとき、予測値Y0^の予測区間（信頼率α）は次のようにして求まります。

D0^2はマハラノビスの汎距離と呼ばれるもので任意の値（Ｘ10、Ｘ20、・・・Ｘｐ0）と（Ｘ1、Ｘ2、・・・Ｘｐ）それぞれの平均との統計的な距離を表します。

例えば本例で”Ｘ１＝２”、”Ｘ２＝１”とした場合の予測区間（信頼区間９５％）は次のようになりました。

-------------------------------------------------------------------------------------------

以上①から⑤までが重回帰分析のおおまかな流れになるかと思いますが、⑤の予測に関しては相場の分析には無意味なことだと考えていますので、実際の分析は①から④まで押さえておくぐらいで十分です。

本例の場合、散布図と重相関係数、③、④の検定の結果から説明変数”Ｘ1”のみの要素を取り入れて、次のようなルールの売買システムを採用します。

前の週サヤが拡大に動いた場合は縮小のサヤ取りポジションを作り、週末に手仕舞いします

前の週サヤが縮小に動いた場合は拡大のサヤ取りポジションを作り、週末に手仕舞いします

このルールでシュミレーション売買した場合以下のような結果となりました。

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　ＰＦ：プロフィットファクター

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　ＰＲ：ペイオフレシオ

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　ＭＡＸＤＤ：最大ドローダウン

途中にシステムが機能していない時期や大きいドローダウンもみられますが結果として１２０pips付近まできてますので、まずまずのパフォーマンスであると判断できます。

ちなみに説明変数”Ｘ２”の要素を取り入れて、次のルールを付け加えた場合のシュミレーションはこうなりました。

前の週の”Ｘ２”の絶対値が”Ｘ２”全データの標準偏差より大きい場合は仕掛けを見送る

ルールを追加しない場合とさほど変わりはない感じですが、１回の売買における損益期待値のパフォーマンスが落ちています。やはり”Ｘ２”の要素を取り入れての追加ルールにはあまり効果がないと判断しました。

●この章で紹介した重回帰分析の各種統計量は次のエクセルの関数を使って計算できます。

LINEST()関数を使えば、回帰係数、標準誤差、重相関係数など必要な統計量をいっきに求めることができます。INDEX()関数やOFFSET()関数などを組み合わせれば必要な統計量を好きな風に取り出すこともできます。

（例） =INDEX(LINEST(OFFSET(A1,0,0,COUNT(A1:A100),1)

分散と共分散の値　=COVAR(配列 1,配列 2)

Ｆ値　　　=FINV(有意水準α,自由度fR,自由度fE)

ｔ値　　　=TINV(有意水準,自由度fE)
逆行列　=MINVERSE(行と列が同じ数の配列)

このページの先頭へ