データの分析についてわからない部分があります

フォーラムルール
新規投稿は質問のみとさせていただきます。

返信する


BBCode: OFF
スマイリー: OFF

トピックのレビュー
latexコード入力

プレビューの表示/非表示を切り替える
投稿前に利用規約をご確認ください。
   

ファイルを添付します

添付ファイルの最大サイズは 1 MiB です

展開ビュー トピックのレビュー: データの分析についてわからない部分があります

Re: データの分析についてわからない部分があります

by ゲスト » 2025/3/29(土) 17:13:25

分散の意味が分かれば理解出来ると思うので、説明してみますね。

分散は、データのばらつき度合いを表す指標です。

例えば直近5日間の気温が
①10度、10度,12度、8度、10度の場合
②0度、20度、10度、4度、16度の場合

どちらも5日間の平均気温は10度ですが、②の方がばらつきが大きい感じがしますよね? このばらつき度合いをどうにかして数値化したい。

そう考えたときにまず思いつくのが、平均とのズレを足し合わせて5で割る方法ですけど、そうすると①、②のどちらの場合も0になってしまいます。これは「平均」の定義とか性質を思い出してもらえれば、当たり前のことだと分かると思います。

そこで次に、平均とのズレを2乗したあとで5で割るという方法を考えてみます。
①の場合は、((10 - 10)^2 + (10 - 10)^2 + (10 - 12)^2 + (10 - 8)^2 + (10 - 10)^2) ÷5 = 1.6。
②も同じように計算すると、54.8となります。
②の方が大きくなりましたよね? つまりこれは、ばらつきを示す指標として使えそうです。で、これのルートをとったもの(1回2乗しているので元に戻す)を分散と呼んでいます。

つまり今回の問題の場合、元のデータがあれば平均のようにx/6のような形で、分散の2乗を(平均からのズレの2乗を足し合わせたもの)/6という形で求めることが出来ます。

しかし今回の問題では元のデータが与えられておらず、代わりにそのデータの分散と平均値が与えられています。
ここで便利なのが、
(分散の2乗) = (2乗の平均) - (平均の2乗)
という公式です。
この式の導出はちょっとめんどくさいので省きますが、これはどのような場合でも成り立ちます。
例えば 先ほどの気温の例で言うと、
①の場合
(10^2 + 10^2 + 12^2 + 8^2 + 10^2) ÷ 5 = 101.6 ←2乗の平均
10^2 = 100 ←平均の2乗
(2乗の平均) - (平均の2乗) = 1.6 ←分散の2乗
先ほど求めた結果と一致していることが分かると思います。

データの分析についてわからない部分があります

by ゲスト » 2025/3/29(土) 17:03:44

高校数学についての質問です。
10個のデータがある。
そのうちの6個のデータの平均値は3、分散は9であり、残りの4個のデータの平均値は8、分散は14である。
分散の解き方は(2乗の平均)−(平均の2乗)の式を使うことは分かっているのですが、平均のようにx/6=9という式を作っても求められない理由は何でしょうか?
なんとなく求められないということしかわかりません…。言語化ができないので誰か教えていただきたいです。

ページトップ