RCI


<3つの係数>

相関係数といえば、次の3つが統計学の教科書に載っている。

RCI とは、順位相関指数(Rank Correlation Index)の略である。
そして、テクニカル分析の世界では、「スピアマンの順位相関係数」 のことを指している。
しかし、ここでは、3つとも説明することにする。


<ピアソンの積率相関係数>

たとえば、「体重」 と 「年収」 に相関があるかを調べるとする(よほど特殊な職業でない限り相関はないと思うが)

n 人の人を調査して、体重を x( i )、年収を y( i ) とし、座標上に点 ( x( i ), y( i ) ) を描き入れたのが右の図( i = 1, 2, …, n)。これを 「散布図」 という。

Mx , My を次式で表される平均値とする。 

Sxx , Syy , Sxy を次式で定義する。
ピアソンの積率相関係数を RP で表すことにしよう(P は Pearson の頭文字)。
RP を次の式で定義する。
tec_rci10.gif

<性質>

-1≦RP≦1 である(これはャVュワルツの不等式から証明できる)
いろいろな散布図に対して、RP の値を計算したのが下の図。

(a)

RP = 1.00
(b)

RP = 0.76
(c)

RP = 0.00
(d)

RP = -0.81
(e)

RP = -1.00


散布図が、直線的に右肩上がりになっていると、RP = 1 である[ 図(a) ]。
逆に、直線的に右肩下がりなら、RP = -1 である[ 図(e) ]。

完全に直線的ではなくても、おおむね右肩上がりなら、RP はそれなりに大きな値になる[ 図(b) ]
おおむね右肩下がりの傾向があれば、それなりのマイナスの値になる[ 図(d) ]。

なんの傾向もないなら、RP はゼロに近い値になる[ 図(c) ]。

「体重」 と 「年収」 の例ならば、次のようになるだろう。

(b) ならば、体重が増えるほど年収は高くなると結論できる。
(d) ならば、体重が軽いほど年収は高いことになる。
(c) ならば、体重と年収に相関はないということになる。
体重と年収のようなデータでは、(a) や (e) のような完全な直線になることはまずないだろう。


計算法から容易にわかることだが、定数 K を加えて、x( i ) のかわりに x( i ) + K を用いても RP の値は変わらない。y( i ) についても同様である。
つまり、散布図を平行移動しても、相関係数は変わらない。

また、K>0 ならば、これを掛けて、x( i ) のかわりに K*x( i ) を用いても RP の値は変わらない。y( i ) についても同様。
つまり、縮尺を変えても、相関係数は変わらない。例えば、体重をグラムで計ってもポンドで計っても相関係数に影響はない。

縮尺によらないことに関係しているのだが、上の散布図 (a)、(e) で、直線の傾きを 45°として描いていることに深い意味はない。
直線状に点が並んでいれば、RP = ±1 になるのであって、勾配は関係ない。
わずかに右肩上がりでも RP = 1 になるし、やや右下がりでも RP = -1 になる。


<株価に適用>

当日から過去 n日間の株価で、ピアソンの積率相関係数を求めてみる。

たとえば、右図はソニーの 2001年12月14日〜2002年1月10日までの終値のグラフ。
これを散布図と見て RP を求めるのである(右図では RP = 0.74 になる)。

つまり、x( i )、y( i ) を次のように定めて、相関係数を求めることになる。

x( i ) = n - i

y( i ) = P(i - 1)


【注】 P( k ) は、k日前の株価である。通常と逆向きに添え字を付けたため x( i ) = i ではないことに注意。また、当日の株価を P(0) とする関係で、y( i ) = P( i ) ではダメである。
この n日間において、株価がおおむね上昇傾向(右肩上がり)にあれば、RP は1に近い値になり、下降傾向(右肩下がり)にあれば、−1に近い値になるであろう。

つまり、RP は、オシレーターとして使える可能性がある。

下図は、ソニーの2001年10月〜2002年2月のチャート。
下に緑で描いたのが、RP のグラフである(n = 20 とした)。
なお、移動平均線のように描いてある青線、赤線については後で説明する。




<解釈>

RP をテクニカル指標的な立場から解釈し直してみる。

x( i ) = n - i だから、Mx と Sxx は容易に計算でき、次のようになる。

y( i ) = P(i - 1) は株価そのものなので、My は、n日単純移動平均と同じである。
Syy は、株価の分散 σ2 と次の関係にある。
Syy = (n-1) σ2
そして、Sxy は、次のように変形できる。



最後に出てくる和は、My の意味からゼロになる。
x( i ) = n - i 、y( i ) = P(i - 1) を代入し、当日の n日単純移動平均を An[P](0) と書くと、



となる。


いま、 f(i) を次のように定める。
f(i) = 2(n-i)/{n(n+1)} (i = 0, 1, …, n-1)

f(i) = 0 (i≧n)
n = 40 のケースを図示したのが右図。

これを係数にして平均を取ったものを Tn と書くことにする。
すなわち、
Tn[P] = AVGf[P]
である。

Tn は、直近の株価によりウエイトをかけて平均を出しているので、n日単純平均よりも株価の動きに素早く反応する。つまり、n日単純移動平均よりも、“短期” の移動平均といえる。

たとえば、Tn について、係数の重心ともいえる SFT を計算してみると、
tec_rci17.gif
となる。
n日単純移動平均の SFT は、(n-1)/2 だから、SFT の比較という観点からは、
Tn は、(2n+1)/3 日移動平均である
といえるかもしれない。


結局、An、Tn などの記号を使うと、Rp は次のように表せることになる。
なお、当日の値を表すという意味で、Rp や σ にも 「(0)」 をつけた。
はじめの定数を無視すると、Rp とは、
短期線 Tn[P] と長期線 An[P] の差を、ボラティリティ σ で割って規格化したものである
といえる。

先のソニーのチャートには、Tn と An を描き入れておいた。
短期線 Tn(赤線)と長期線 An(青線)について次の性質は明白である。
短期線が長期線の上にある[下にある] ⇔ Rp>0 [<0] である

<ベクター・モメンタム>

ベクター・モメンタムというのがここのページに書いてある。
有名な指標なのかは知らない。

要するに、株価をチャート表示したとき、直近 n日における回帰直線の傾きのことらしい。
回帰直線の傾きを m とすると、これは次の式で与えられる(詳しくは統計の本を参照してください)

これまでに得られた式を使うと、次のように表現できる。
初めの定数を除くと、ベクター・モメンタムとは2本の移動平均線 Tn と An の差のことである。

そして、RP とは次の式で結び付けられる。
つまり、RP とは、ベクター・モメンタムをボラティリティで割って規格化したものといえる。


<スピアマンの順位相関係数>

ピアソンの積率相関係数には、欠点がある。

例えば、散布図が右図のようになっている場合。
明らかに右肩上がりになっているが、RP = 0.91 である。
完全に直線的に並んでいないと RP = 1 にならないためである。
しかし、右図の場合、相関係数は1になる方が自然だろう。

そこのところを改良したのが、スピアマンの順位相関係数である。
n個のデータの場合、x( i ) をそのまま考えるのではなく、x( i ) のうち1番小さいものに1を割り当て、2番目に小さいものに2を割り当てるという具合に順位をつけていく。

例えば、データ4個で、

x(1) = 50
x(2) = 32
x(3) = 18
x(4) = 45
だったとする。
このとき、R[x(i)] を小さいものから数えた順位(Rank)と定義する。
上の例なら、
R[x(1)] = 4
R[x(2)] = 2
R[x(3)] = 1
R[x(4)] = 3
とするわけである。
【注】 値の等しいものがある場合は “平均順位” を付ける。平均順位についてはここのサイトを見ればわかると思う。
y( i ) についても同様にする。
そして、R[x( i )]、R[y( i )] について、ピアソンの積率相関係数をとったものを、スペアマンの順位相関係数という。
ここでは、Spearman のかしら文字を取って RS と書くことにする。

下図は、順位を考える前と、順位で考えた後の散布図の違い。


順位を考える前

順位を考えた後


同じ右肩上がりだが、順位を考えることで、相関係数が1になるわけである。


<計算法>

R[x( i )]、R[y( i )] は、順序を除けば 1〜n の値をとる。
そのため、RS の計算は著しく簡単化でき、次のようになることが知られている(導出も難しくない)

株価の場合は、x( i ) = n - i なので、R[x( i )] = n - i + 1 である。
注】 値の等しいものがあって平均順位を使っている場合は、この公式は正しくない。

<株価に適用>

株価にスペアマンの順位相関係数を適用したのが RCI である。


R[x( i )] = n - i + 1R[P(i - 1)] についてピアソンの積率相関係数を求めることになる。
しかし、ピアソンの積率相関係数は平行移動しても値が変わらない。
だから、x( i ) = n - iR[P(i - 1)] について RP を計算しても同じである。

結局のところ、株価が、

P(0)=100, P(1)=110, P(2)=90, P(3)=80, P(4)=95
となっていたら、これを順位化し、
P(0)=4, P(1)=5, P(2)=2, P(3)=1, P(4)=3
とみなして、そのまま RP を計算すれば RCI になるというだけのことである。


株価が右肩上がりのとき、相関係数が1になる方が具合がよいので、ピアソンの積率相関係数を使うより、スペアマンの順位相関係数を使う方がよいというのも理屈ではある。

しかし、一長一短があると思う。
たとえば、下図。
左側の図は株価をそのまま散布図にしたもの。株価は2日目に急騰し、その後少しずつ値を下げながら調整し、最後に再び急伸している。
これに順位を割り当てて散布図を描いたのが右側の図。大きなN字型になっている。


順位を考える前
RP = 0.50

順位を考えた後
RS = -0.15

この場合、直観的には上昇トレンドと見るのが普通だと思う。
ピアソンの積率相関係数は、0.50 で、上昇傾向であることを示している。
しかし、スピアマンの順位相関係数は、-0.15 であり、やや下降傾向を示している。

この例では、ピアソンの積率相関係数の方が、直観に合っているように思う。


しかし、実用的には、この2つの係数にあまり違いはないようである。
下図は、ソニーの以前に示したのと同じ期間で、RP と RS を比較したもの(n = 20)。
緑線が RP、赤線が RS である。大差ないといえるだろう。




<ケンドールの順位相関係数>

ケンドールの順位相関係数は、3つの相関係数の中では、一番理解しやすい。

今までと同じく、x( i )、y( i ) の n個のデータがあるとする。
i = 1, 2, …, n のうちから異なる2つの値を選ぶ(選び方は、n(n-1)/2 通りある)。
選んだ番号を a、b とする。

[ケース A]
「x(a)<x(b) かつ y(a)<y(b)」 または 「x(a)>x(b) かつ y(a)>y(b)」 の場合。
すなわち、散布図上でこの2点を結ぶ線分が右上がりになっている場合。

[ケース B]
「x(a)<x(b) かつ y(a)>y(b)」 または 「x(a)>x(b) かつ y(a)<y(b)」 の場合。
すなわち、散布図上でこの2点を結ぶ線分が右下がりになっている場合。
あらゆる選び方を実行し、ケース A の場合が P 個、ケース B の場合が Q 個あったとする。
このとき、ケンドールの順位相関係数 RK は次のように定義される。
要するに、ケース A なら +1点、ケース B なら -1点とするとき、ランダムに一組選んだときの、得点の期待値である。

上の式は、各 x( i ) と 各 y( i ) に値の等しいものがない場合の定義である。
株価に適用する場合、各 x( i ) は相異なるが、y(i) には値の等しいものがあるかも知れない。
その場合を含めるには、次のようにするらしい。
P、Q は先ほどと同じに定義して、RK を次の式で定義する。

値がすべて異なれば、P + Q = n(n-1)/2 なので、先の式に一致する。


下図は、ソニーの先ほどと同じ期間について、RS(赤線) と RK(青線) を比較したもの(n = 20)。


かなり違うように見えるが、よく見ると常に RK が内側になっているかんじである。
この例では、だいたい RK ≒ 0.75*RS になっていて、グラフの形状自体はほとんど同じようである。


<日本だけ?>

RCI は、統計学の常識らしく、社会科学などでよく使われているらしい。
それを、そのまま相場に当てはめて使っているわけだろう。

PearsonSpearmanKendall は、もちろん相場師ではない(Pearson と Kendall は統計学者、Spearman は心理学者)。

RCI は、テクニカル分析に関する外国の本やサイトには載っていないようである。
よく調べていないのだが、相場の世界で普及しているのは、日本だけなのかもしれない。


前のページ目次に戻る次のページ