4.
典型的な統計的検定の問題です。特にT検定は非常に出題率も高いのでしっかりと覚えましょう。
が、初見ではチンプンカンプンでしょう。問題を読みながら説明していきましょう。
統計的検定に関する以下の文章の空欄AとBに入る語句の組み合わせとして、最も適切なものを下記の解答群から選べ。なお、検定においては、下の t 表を使用すること。
まず、統計的検定とは何でしょうか。一般的な用語としての、統計的検定とは、何かしらの仮説に対して、それを証明するエビデンスデータを用いて、その仮説の評価を行い実証することを言います。
ここでは、製品特性がその検査の対象となっています。製品特性ってなんだろなってのもありますが、ユーザがその製品に対して期待する要素、その製品の性質、耐久性とか、製品品質とかそういったものの何かになります。生産条件により、この値は変化していき、企業はどのような条件で生産を行うか検討するため、このような統計的検定をやる場合は多いです。
さて、t表というのが問題に出てきているので、見てみましょう。自由度ってなんでしょう。統計学的に、その定義を言うと、観測して得たデータのうち、自由に値を決めることができるデータの数を自由度と言います。しかし、それを言っても、なんのこっちゃとなってしまいそうです。ここでは、ある条件があって、仮説から自由に値を決めることができるサンプルの数としておきましょう。
そして、右の値は何の値でしょうね。これは正規分布の上側(右側)が5%の割合になる場合の、統計値(T値)です。
ある製品特性の平均値は 65.5 である。
平均値がまずは定義されました。65.5 というのが平均ですね。
この特性について、技術部門で新しい生産条件を設定して実験し、 9 個のサンプルを得た。その平均値は 71.0、標準偏差は 9.0 であった。
何やら、技術部門が生産条件んちういて改善?して、取り直したようですね。そこで製品サンプルを9個得たわけですが、その平均値はやや上がって、71.0になりましたと。そして、標準偏差は9になったと。
生産条件の変更によって特性の平均値が上がったか否かを、有意水準 5 %で t 検定したところ、検定統計量の値は [ A ] 。
有意水準とはなんでしょう?
有意(ゆうい、独: Signifikanz、英: significance)は、確率論・統計学の用語で、「確率的に偶然とは考えにくく、意味があると考えられる」ことを指す。
P値
帰無仮説の下で実際にデータから計算された統計量よりも極端な(仮説に反する)統計量が観測される確率を、P値という。P値の利用に伴う諸問題を考慮した社会心理学系のジャーナル、Basic and Applied Social Psychology(BASP)は、帰無仮説有意性検定およびそれに類する統計学的処理を禁止すると発表した[2]。
有意水準
有意水準α (0<α<1) は、どの程度の正確さをもって帰無仮説を棄却するかを表す定数である。有意水準αの仮説検定は、の時にを棄却する。このとき、「統計量はα水準で有意である」という。有意水準αは仮説が正しいにもかかわらず仮説検定で棄却してしまう確率(第一種の誤りを犯す確率)に等しい。日本工業規格では、「第一種の誤りの確率の上限値」と定義している[3] 。
有意水準の値としては、0.05 (5%) を用いるのが一般的であるが、そのとり方は学問・調査・研究対象によっても違いがあり、社会科学などでは0.1(10%)を用いる場合もあり、厳密さが求められる自然科学では0.01(1%)などを用いる場合もある。また、データ表示に当たっては有意性に段階をつけて複数の有意水準を同時に用いることもあり、たとえば0.05水準で有意ならば * 、0.01水準と0.001水準に対してはそれぞれ ** 、 *** と表示する。
有意であるからといって「偶然ではない」と断定できるわけではなく、「偶然とは考えにくい」という意味に過ぎない。したがって、たとえば有意水準5%で有意という場合には、「実際には偶然に過ぎないのに、誤って『意味がある』と判断している」可能性が多くて5%ある。
逆に、の場合は、「有意差があるとはいえない」とまでしかならない。
「有意」『フリー百科事典 ウィキペディア日本語版』。2022年11月15日 (火) 02:49 UTC、
URL: 有意 - Wikipedia
つまり極端な値を捨てた、意味のある値となる水準のことを有意水準というようですね。で、一般的には5%が用いられるということで、この問題でも5%となっています。
次に、t 検定とはなんでしょうか。
t検定(ティーけんてい)とは、帰無仮説が正しいと仮定した場合に、統計量がt分布に従うことを利用する統計学的検定法の総称である。母集団が正規分布に従うと仮定するパラメトリック検定法であり、t分布が直接、もとの平均や標準偏差にはよらない(ただし自由度による)ことを利用している。2組の標本について平均に有意差があるかどうかの検定などに用いられる。統計的仮説検定の一つ。日本工業規格では、「検定統計量が,帰無仮説の下でt分布に従うことを仮定して行う統計的検定。」と定義している[1]。
スチューデントのt検定(Student's t-test)とも呼ばれるが、これは統計学者のウィリアム・ゴセットが雇用者であるギネスビール社に本名使用を許されずStudent というペンネームで最初の論文を発表した(1908年)ためである。
種類[編集]
t検定は大きく次のように分けられる。
「T検定」『フリー百科事典 ウィキペディア日本語版』。2022年12月12日 (月) 07:56 UTC、
URL: t検定 - Wikipedia
帰無仮説とは、捨てるべきか捨てないべきかを決めるための仮説です。否定されることを期待としており、この仮説が正しいとは、要素が意味がなかった、つまり無に帰す仮説というわけです。
さて、話は出そろいました。つまり問題は、生産条件を変更することによって、製品特性が向上したかどうかを検定しなさいということですね。
・「生産条件を変更後、製品特性が65.5を超える」ということが検定で出すことができるか。
■T値の求め方
T値 = (平均値の差) / (標準偏差 ÷ √サンプルサイズ)
= (71 - 65.5) / (9 ÷ √9) = 5.5 / 3 = 1.83333
標準偏差はちなみに、√分散ですので、分母は、√(分散/サンプルサイズ)とも言えますね。さらに分散は、サンプルから平均値を引いた値を2乗した合計値です。
■自由度
サンプル数 - 1 となります。よって、自由度は8です。
表の自由度8のところを見ると1.860となっています。よって、今回求めたT値がそれよりも小さいことが分かります。T値が大きければ、有意な差があると言えますが、小さいため、有意であるとは言えません。つまり、平均値があがったとは言えません。
[A] => 1.860 より小さくなった
[B] => いえない
ということで、4が正解です。