数か月からデータサイエンスの統計を勉強しています。

1)複数を比較する必要がある場合、それを学んでいます。サンプル(> 2)の場合、T検定は面倒であり、代わりにANOVAを使用して「F検定」を実行します。

2)ある種の理解を超えると、「F検定とT検定の間の相互に排他的な要件」が作成されます。

3)T検定(それでも:1)も学びました。 sample / paired / 2 sample)は基本的に平均の違いをテストしますが、「F検定」は分散の違いをテストします。

4)ここで、2つのサンプルグループの平均がほぼ等しいが分散が大きく異なるとします。 、両方のテストで異なる答えが得られますか?

T検定では「違いはありません」と表示されます。ただし、「F検定」は、「それらは異なる」と言います。

または、逆の場合でも。 (平均は大きく異なりますが、分散はほぼ同じです)。

5)では、何に基づいて(平均?または分散?)、最終的にそれらの真の違いを決定しますか?

6)質問は次のとおりです:それらはどのように関連していますか?元の目的が2つ以上のサンプルが異なるか、まったくないことを見つけることであった場合、サンプルグループの数が少ない場合の「平均の検索」(つまり、T検定の選択)が「分散の検索」に変更されます。 > 2ですか? (事実が:分散と平均が基本的にサンプルグループの独立した特性である場合)

7)これらの両方のメトリックをチェックして、2つのサンプルが本当に異なるかどうかを確認する必要がありますか?

(私が述べたポイントにシリアル番号を記載しました。それらのいずれかが基本的に間違った理解であるかどうかを指摘してください。各ポイントに回答を与えていただければ幸いです)

コメント

  • サンプルの比較"とはどういう意味ですか"?彼らが来る人口の平均が同じ/異なるかどうかを比較することについて話しているのですか?それとも、それらの分布が同じ/異なるかどうかを確認することについて話しているのですか?
  • わかりません!!それが私が知りたいことだからです。 "これら2つのサンプルグループがすべての面で異なるかどうかを判断するために、両方を探すべきではありませんか?"このビューを強調するチュートリアルは見つかりませんでした。ほとんどのチュートリアルは"のように説明しています… 3つ以上のグループを比較するには、F検定に進みます。…"。そのとき、視点は"平均を見る"から"分散を見るように変わります。 !! " ..したがって、これについては明確ではありません!
  • 統計の新入生として、私は何に注意すべきかわかりません!..ほとんどチュートリアルの数は言う.. " T検定またはF検定" ..どのチュートリアルも" TとFの両方をチェックしてください!! (私の意見:'両方の角度から見るべきではありませんか?(つまり、平均と分散)?
  • 以下のリンクの種類はそこに行きます:すでに参照しましたが、私の質問に正確に答えているわけではありません): stats.stackexchange.com/questions/78150/ …
  • そうですね、"テスト"を作成すると、質問に対する答えが見つかります。最初に知っておく必要があるのは、実際の質問が何であるかです!

回答

t検定という用語検定統計量にt分布がある(ヌル仮説の下で)検定はt検定と呼ばれ、検定統計量にF分布がある検定はF検定と呼ばれるため、F検定はあいまいです。これらのインスタンスは複数あります。

2つのサンプルの分散を比較するF検定があるため、これはあなたの質問に関連していますが、これはFではありません -標準のANOVA分析で使用される検定。実際、ANOVA F検定はグループ間とグループ内の変動性を比較し、グループ間の変動性は実際にはグループ平均間の差を2乗して合計することによって測定されるため、この設定ではt検定とF検定の両方が比較になります。グループとは。実際、グループ/因子レベルが2つしかない場合、F検定統計量はt検定統計量の二乗であり、F検定は両側t検定と同等です。 3つ以上のグループの場合、t検定の問題は、t検定で一度に2つのグループしか比較できないことです。つまり、すべてのグループを比較するには、多重検定の問題を含む複数のt検定が必要になります(つまり、 5%レベルでいくつかの仮説をテストします。ヌル仮説がすべて真であると仮定して、少なくとも1つの誤った有意性を見つける確率は、5%よりも大幅に高くなる可能性があります。

さらに、平均間の差異と分散間の差異の両方を調査することに関心があるかもしれません。また、平均が同じグループでも分散が異なる可能性があります。実際に両方をチェックすることもできますが、これも多重検定を伴います。無料の昼食はありません。ANOVAの多くのアプリケーションでは、等しい分散を仮定することはかなり合理的であるか、または平均の違いだけが実質的に関心があります(たとえば、あるグループが別のグループよりも「優れている」かどうかだけ疑問に思う)、したがって分散の違い多くの場合、明示的に調査されていません(これが「良い」か「正しい」かについての記述は控えます。むしろ、私の答えは「状況によって異なります…」です)。

コメント

  • 説明ありがとうございます

回答

3つ以上のグループを比較していて、それらの平均を比較することに関心がある場合は、通常、ANOVAを実行します。これは、すべてのグループ平均が等しいという仮説をテストします。複数の $ t $ <を実行します。 / span>-各テストは、これら2つのグループの平均が等しい場合にのみ検定するため、テストは完全に同等ではありません。ポイント1)

$の使用F $ テストからc ANOVAで比較するのは、グループ平均間の分散とグループ内の分散であるため、ompare分散が使用されます。 (あなたのポイント3)

上記の私のポイントを参照してください。何が起こっているのかについて誤解があると思うので、残りの質問に答えるのは難しいです。

回答

この式を検討する

Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2 
  1. 実用性の観点からこれは本当の正しいかもしれません。

2。対照群と治療群が同じ集団を形成している場合、それらは同じになります。ただし、男の子と女の子、location1とlocation2がある場合は、異なる可能性があります。

  1. 正解です。
  2. おそらく
  3. あなたの目的に応じて。グループの特性(平均など)が異なるかどうかを単に知りたい場合は、t検定を行います。特定の適用された要因(さまざまなレベルのタバコのニコチンなど)が有意な影響を与えるかどうかを知りたい場合は、F検定を使用してください。
  4. 式は関連していますが、アプリケーションは目標によって異なります。 。

  5. いいえ。t検定とF検定の目標や問題が異なるため、意味がありません。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です