by yamada » 2025/3/10(月) 14:25:13
最初の質問ですが
共分散、分散の計算をちょっと楽にする方法ならあります。
Xの平均値をE[X]=μのように表します。
Xの分散は、
E[(X-μ)²]=E[X²]-2μE[X]+μ²=E[X²]-μ²
データから平均値をいちいち引いてから2乗和をとり平均を求めるより、データの二乗和の平均を取ってから平均値の2乗を引けばよいので計算が楽になります。
同様に、Xの平均値をμx, Yの平均値をμyとして、共分散はE[(X-μx)(Y-μy)]=E[XY]-μxμyのように表せます。
これらを使うとちょっとは楽になると思います。
例えば、(x,y)の組が(1,2) (3,4) (5,6)なら、
Xの平均は3
Xの分散は(1²+3²+5²)/3 - 3² = 2.67
Yの平均は4
Yの分散は(2²+4²+6²)/3 - 4² = 2.67
X, Yの共分散は(1×2 + 3×4 + 5×6)/3 - 3×4 = 2.67とかですかね
2つ目の質問ですが
ベクトルを使った考え方だと簡単に言えるので
それで話をすればいいと思います。
まず高校範囲のベクトルについて復習
2つのベクトルa,bについて
aとbとのなす角が0°とは
この2ベクトルの向きが等しい事
aとbとのなす角が180°とは
この2ベクトルが逆向きである事
いずれの場合もb=kaとなる実数t(≠0)が存在する
a=(a1,a2),b=(b1,b2)とすると
b1=ka1かつb2=ka2
高校では3次元の話まで学習するが
4次元以上でもこれは同じ事です。
※「x[i]の平均」をx*と表記します
x,yの偏差ベクトルをX,Yとすると
この2ベクトルのなす角のcosが相関係数
相関係数が1とはなす角が0°
相関係数が-1とはなす角が180°
いずれの場合もY=kXとなる実数kが存在する
よって任意のiについて
(y[i]-y*)=k(x[i]-x*)
y[i]=k(x[i]-x*)+y*
すなわち任意のiについて(x[i],y[i])は
直線y=k(x-x*)+y*上です
長くなりましたが、ご確認お願い致します。
最初の質問ですが
共分散、分散の計算をちょっと楽にする方法ならあります。
Xの平均値をE[X]=μのように表します。
Xの分散は、
E[(X-μ)²]=E[X²]-2μE[X]+μ²=E[X²]-μ²
データから平均値をいちいち引いてから2乗和をとり平均を求めるより、データの二乗和の平均を取ってから平均値の2乗を引けばよいので計算が楽になります。
同様に、Xの平均値をμx, Yの平均値をμyとして、共分散はE[(X-μx)(Y-μy)]=E[XY]-μxμyのように表せます。
これらを使うとちょっとは楽になると思います。
例えば、(x,y)の組が(1,2) (3,4) (5,6)なら、
Xの平均は3
Xの分散は(1²+3²+5²)/3 - 3² = 2.67
Yの平均は4
Yの分散は(2²+4²+6²)/3 - 4² = 2.67
X, Yの共分散は(1×2 + 3×4 + 5×6)/3 - 3×4 = 2.67とかですかね
2つ目の質問ですが
ベクトルを使った考え方だと簡単に言えるので
それで話をすればいいと思います。
まず高校範囲のベクトルについて復習
2つのベクトルa,bについて
aとbとのなす角が0°とは
この2ベクトルの向きが等しい事
aとbとのなす角が180°とは
この2ベクトルが逆向きである事
いずれの場合もb=kaとなる実数t(≠0)が存在する
a=(a1,a2),b=(b1,b2)とすると
b1=ka1かつb2=ka2
高校では3次元の話まで学習するが
4次元以上でもこれは同じ事です。
※「x[i]の平均」をx*と表記します
x,yの偏差ベクトルをX,Yとすると
この2ベクトルのなす角のcosが相関係数
相関係数が1とはなす角が0°
相関係数が-1とはなす角が180°
いずれの場合もY=kXとなる実数kが存在する
よって任意のiについて
(y[i]-y*)=k(x[i]-x*)
y[i]=k(x[i]-x*)+y*
すなわち任意のiについて(x[i],y[i])は
直線y=k(x-x*)+y*上です
長くなりましたが、ご確認お願い致します。