1.
(設問 2 )
実験の結果を分散分析し、下表を得た。平均平方および分散比を計算して検定をした結果、有意水準 5 %(下表右参照)で有意となる要因の数として、最も適切なものを下記の解答群から選べ。なお、分散比計算後、プーリングは行わないこととする。
これは、単語がよくわからないと、造語が頻出するRPGみたいに、本当に何がなんやらという感じになりそうです。私もですが、統計学をそこまで学んでいない人も多く、この試験を受けることから、この辺は、難易度以上に正答率は低いのではないでしょうか。
分散分析手法が重要になってくる問題ですが、さすがに統計学をバリバリ学んだ人向けの、ひねった問題は出ることはないので、代表的な解き方さえ覚えておけばよいかと思います。この分散分析手法についても、求め方さえ覚えていれば、計算自体は簡単です。
とりあえず、分散分析についてWikiがあったので掲載しておきます。
まず、ひとつひとつ考えていきましょう。分散分析とは、「観測データにおける変動を誤差変動と各要因およびそれらの交互作用による変動に分解することによって、要因および交互作用の効果を判定」まあ、各要因の良し悪しを分析するというところでしょうか。
まずは、表を整理しましょう。各種要因については、前の問題にありました。誤差が入っているのがポイントです。6行目までは、実験提唱となる要因です。ざっくりと6パターンの事件がされましたって読んでおきましょう。誤差というのは、同じ条件で再度やったときの誤差、ばらつきというものです。
つぎに、横軸について、平方和と自由度がすでに値が埋まっています。分散分析については、この4つ平方和、自由度、平均平方、分散比を求めるというのが定石です。
そして、横にF (xxxxxx) = N というのがありますね。いわゆるF検定というやつですが、詳細はここでは省きます。それぞれの分散比と比較して、この値より大きければ有意であるといえるということです。
さて、まず表には、平方和と自由度がすでに計算されています。これらはどういった値でしょう。まず平方和については、「データと平均値の差の2乗の合計値」です。これが計算済みとはありがたい。これがどういう値なのか、これが意図するところは、平均値と比較したときに、データがどれだけずれているのか表すものです。データのバラバラ具合をみるわけですね。
さて、自由度ですが、よくデータがいくつかあって、自由に設定できるデータの数といわれます。今回はすべて1となっています。
さて、我々が求める必要があるのが、平均平方と分散比です。まず平均平方ですが、平方和を自由度で割ることで算出することがでけいます。ばらつきの自由に決められるデータ数で割って、ばらつきを推定した値となります。
平均平方 = 平方和 / 自由度
次に、分散比です。分散比というくらいなので、分散の比率なわけですが、なんの比率?って思いますよね。まず、各要因のばらつきの大きさとの比率ですが、対して、誤差のばらつきの大きさとの比率を求めます。誤差の平均平方は、表から4というのがわかります。分散比をそれぞれ求めてみます。
A:分散比=1.5
B:分散比=6.25
C:分散比=0.75
D:分散比=5.25
A#B:分散比=0.5
A#C:分散比=0.5
分散比が、優位水準5%以上であれば優位と判断すると条件があります。で、5%以上というのが、どくれいなのかというのが表の右側にすでに計算されています。全部、どれを比較しても、大きいものがありません。というわけで、答えは0個となります。
以上より、1が正解となります。