標準偏差についてわからない部分があります

高校生用の質問にご利用ください。
フォーラムルール
新規投稿は質問のみとさせていただきます。
返信する
ゲスト

標準偏差についてわからない部分があります

投稿記事 by ゲスト »

確率・統計の用語についての質問です。質問は前提の説明後の最後になります。

【前提】
(1) 正規母集団N(μ,σ**2) から無作為に抽出した n個の標本を { x_ i } (1≦i≦n) とします。
ただし **2 は二乗を意味するものとします。

(2)このとき標本平均 x_ は
x_ ≡ (1/n)×Σx_i
で定義され、x_ もまた正規分布に従いその期待値はμ、分散は(σ**2)/n になります。
すなわち x_ 〜 N(μ, (σ**2)/n ) です。

(3) x_ の標準偏差は標準誤差(standard error)と呼ばれ、これをSEで表すことがあります。すなわち
SE ≡ σ/√n
です。

(4)σハットの2乗を
σ^**2 ≡ (1/(n-1))×Σ(x_i - x_)**2
で定義すると、σ^**2はσ**2の不偏推定量であり不偏分散と呼ばれます。

【質問】
標準誤差 SE ≡ σ/√n のσを σ^ に置き換えた統計量
σ^ / √n
には何か名前が付けられていますか?
特に σ/√n との違いを意識した呼び方があるのであれば知りたいです。

調べてもσ^ / √n の正式な名称が見当たらないので、あくまで個人的にですが、
σ/√n と σ^/√n の差違を理解したり、σ^/√nを証明などに使用するときに
標準誤差 SE ≡ σ/√n (standard error)
のほうを、あえて母をつけて母標準誤差といい、これと対照するように
^σ/√n のほうを標本標準誤差 (SSE: samples standard error)
と呼ぶようにしていますが、定着した呼び方ではなさそうなので、
統計に詳しい方や実務家の方々の間では
σ^ / √n を(σではなくσ^を使うことを意識したときに)何と呼ぶことが多いのか知りたく、質問させて頂きました。
ゲスト

Re: 標準偏差についてわからない部分があります

投稿記事 by ゲスト »

標本の大きさnが大きいとき(目安としてn≧30)
母集団の正規性の条件がなくても
➀標本分散(偏差2乗和をnで割った値)u^2
②不偏分散(偏差2乗和をn-1で割った値)s^2
③母分散が既知な場合、母分散σ^2
としたとき、標本平均の標準誤差として、
➀u/√n(←標本標準偏差を用いた標準誤差)
②s/√n(←不偏標準偏差を用いた標準誤差)
③σ/√n(←母標準偏差を用いた標準誤差)
以上の3通りのどれを用いても大丈夫です。あまりあり得ないですが、母分散σ^2が分かっているなら、③を用います。
なおこのとき、統計量はZ分布に従います。

標本の大きさnが小さいとき(目安としてn<30)
母集団の正規性の条件が必要です。(正規性条件がない場合、やり方が「ノンパラメトリック」の手法になります。)
➀標本分散(偏差2乗和をnで割った値)u^2
②不偏分散(偏差2乗和をn-1で割った値)s^2
③母分散が既知な場合、母分散σ^2
としたとき、標本平均の標準誤差として、
➀u/√n(←標本標準偏差を用いた標準誤差)
②s/√n(←不偏標準偏差を用いた標準誤差)
③σ/√n(←母標準偏差を用いた標準誤差)
以上の3通りのうち、①は使いません。あまりあり得ないですが、母分散σ^2が分かっているなら、③を用います。
一般的にこのような小標本の場合、②を用います。このとき、統計量は自由度n-1のt分布に従います。(【注意】③を用いた場合は、統計量は自由度nのt分布に従うと考えるのか、自由度n-1のt分布に従うと考えるのか、Z分布に従うと考えるのか、の3通り考えられますが、Z分布に従うと考えるのが一般的かと思っています。ここは、私も実験してみたいところです。)

余計な事も記載してしまいすみません。私は
➀u/√n(←標本標準偏差を用いた標準誤差)
②s/√n(←不偏標準偏差を用いた標準誤差)
③σ/√n(←母標準偏差を用いた標準誤差)
のような言い方で使い分けています。
ゲスト

Re: 標準偏差についてわからない部分があります

投稿記事 by ゲスト »

ご回答ありがとうございます。

> 母標準誤差

はググっても該当しないですし、ご指摘の点からも使わないほうが良さそうですね。
また、「数理統計学の基礎」と「現代数理統計学」からの引用ありがとうございます。それらの引用とご知見を伺いますと、単に「標準誤差」と言ったときに、それを標本平均の標準偏差を指すものとして使うか、それとも推定量の標準偏差を指すものとして使うか、どちらがより良いかは文脈によって変わるので、むしろどっちを指すものと決めないほうがよく、誤読の可能性がある場合には、おっしゃるような「平均の」を付けたりして補足する、といった柔軟さを許容するものとして意識しておいたほうが、色々な場面に適応できる、といったように認識しておこうと思います。

> 母標準誤差
とか
> 標本標準誤差
という言葉を作ってそれに慣れてしまって、いざ、誰かに読んでもらう文章を書くときに、これらを使って通じないリスクを冒すよりは、おっしゃるように

> ➀u/√n(←標本標準偏差を用いた標準誤差)
> ②s/√n(←不偏標準偏差を用いた標準誤差)
> ③σ/√n(←母標準偏差を用いた標準誤差)

と書いたほうが誤解が生じる余地も少なくて良さそうですね。
返信する