新しい質問の説明:
たとえば、人体のサイズを調べたいときに、成人の人体のサイズに標準があることがわかった場合偏差が2cmの場合、成人の人体のサイズは非常に均一であると推測されます
これは、比較対象によって異なります。それを非常に均一にする比較の基準?非常に変動する可能性のある特定のタイプのボルトのボルト長の変動と比較すると、
2cmの標準偏差がマウスのサイズは、マウスの体のサイズが驚くほど大きく異なることを意味します。
より均一な人間の例の同じものと比較すると、確かに;正の値しか得られないものの長さに関しては、変動係数を比較する方がおそらく理にかなっています(元の回答で指摘したように)。これは、sdを比較してあなたを意味するのと同じことです。 。
明らかに、標準偏差の意味は平均との関係です。
いいえ、常にではありません。物のサイズまたは物の量(たとえば、石炭のトン数、金額)の場合、それはしばしば理にかなっていますが、他の文脈では、平均と比較することは意味がありません。
それでも、それらは必ずしもあるものから別のものに比較できるわけではありません。すべてに適用される標準はありません。何かが変数になる前にどの程度可変であるか。
平均の10分の1前後の標準偏差は目立たない(例:IQの場合:SD = 0.15 * M)。
ここで比較しているのはどれですか?長さとIQの長さ?あるセットのものを別のセットと比較することが理にかなっているのはなぜですか? 1種類のIQテストの平均100とsd15の選択は完全に任意であることに注意してください。それらには単位がありません。平均0sd1または平均0である可能性もあります。5およびsd0.1。
しかし、標準偏差と平均の関係に関して、「小さい」と見なされるものと「大きい」と見なされるものは何ですか。
元の回答ですでにカバーされていますが、whuberのコメントでより雄弁にカバーされています-標準は1つもなく、できませんあります。
コーエンについての私の指摘のいくつかは、この場合にも当てはまります(平均に対するsdは、少なくとも単位がありません)。しかし、Cohenのdのようなものであっても、あるコンテキストでの適切な標準が別のコンテキストで必ずしも適切であるとは限りません。
以前のバージョンへの回答
常に平均と標準偏差を計算して報告します。
まあ、おそらく多くの場合。 常にそうしているのかわかりません。それほど関係がない場合もあります。
しかし、分散のサイズは実際にはどういう意味ですか?
標準偏差は、平均からの一種の平均*距離です。分散は、標準偏差。標準偏差はデータと同じ単位で測定されます。分散は2乗単位です。
*(RMS- https://en.wikipedia.org/wiki/Root_mean_square )
データの「広がり」(または、標準偏差または分散を計算している場合は分布)について何かを教えてくれます。分布)。
たとえば、空の部屋でどの席に着くかを観察しているとします。大多数の人がほとんど変化なく窓の近くに座っていることがわかった場合、
これは、「どの席」を記録する場合とは異なりますが、 「窓からの距離」を記録します。(「大多数が窓の近くに座っている」ことを知っているからといって、必ずしも平均や平均の分散について何もわかりません。中央値窓からの距離は小さくする必要があります。)
これは、一般的に、人々が窓の近くに座って景色や十分な光を得るのを好むことを意味すると推測できます。座席を選択する際の主な動機付け要因です。
中央値が小さいこと自体は、それを示しているわけではありません。他の考慮事項から推測することもできますが、さまざまな理由が考えられます。データからはまったく識別できません。
一方、最大の割合がウィンドウの近くにあることがわかります。頻繁に使用される他の座席とは大きな違いがあります(たとえば、多くの人がドアの近くに座っている、他の人がウォーターディスペンサーや新聞の近くに座っている)、多くの人が窓の近くに座っていることを好む一方で、座席の選択やさまざまな人々の好みの違いに影響を与える光や視界よりも多くの要因があります。
繰り返しますが、あなたはデータの外部に情報を持ち込んでいます。当てはまる場合と当てはまらない場合があります。日が曇っていたり、ブラインドが描かれているため、窓から離れた方が光が良いことはわかっています。
どの値でc私たちが観察した行動は非常に多様であると私たちは言います(異なる人々は異なる場所に座るのが好きです)?
標準偏差を大きくするか小さくするかは、外部の標準ではなく、主題の考慮事項、およびある程度はあなたが何をしているのかによって決まります。データ、さらには個人的な要因。
ただし、距離などの正の測定値では、平均(変動係数)に対する標準偏差を考慮することが適切な場合があります。それはまだ恣意的ですが、変動係数が1よりはるかに小さい(標準偏差が平均よりはるかに小さい)分布は、1よりはるかに大きい(標準偏差が平均よりはるかに大きい)分布とはある意味で「異なります」。 、これは多くの場合、非常に右スキューになる傾向があります。
その意味で「均一」という言葉を使用することには注意してください。「あなたの意味を誤解しやすいからです(たとえば、人々が」と言った場合)より一般的には、統計について話し合うときは、通常の意味での専門用語の使用は避けてください。
そして私たちのデータが示すわずかな変動は、ほとんどがランダムな効果または混乱する変数の結果です(1つの椅子の汚れ、太陽が動いた、後ろの日陰など)?
いいえ、繰り返しになりますが、あなたは「話し合っている統計量に外部情報を取り入れています」。差異はそのようなことを教えてくれません。
効果量を解釈するためのコーエンのガイドラインと同様に、データの分散の大きさを評価するためのガイドラインはありますか(0.5の相関は大きい、0.3中程度で、0.1は小さい)?
一般的ではありません、いいえ。
-
Cohen “s効果量の議論[1]は、あなたが示すよりも微妙で状況に応じたものです。彼は、議論されていることの種類に応じて、小中大の8つの異なる値の表を示しています。あなたが与えるこれらの数値は、独立した平均の違いに適用されます(コーエンの d )。
-
コーエンの効果量はすべて無次元量にスケーリングされます。標準偏差と分散はそうではありません-単位を変更すると、両方が変更されます。
-
コーエンの効果量は、特定のアプリケーション領域に適用することを目的としています(それでも私は「小、中、大」の標準に焦点を当てすぎて、「私が望むよりもいくらか恣意的で、いくらか規範的である」。それらは、意図したアプリケーション領域には多かれ少なかれ合理的であるが、他の領域ではまったく不適切かもしれない(たとえば、高エネルギー物理学では、多くの標準誤差をカバーする効果が必要になることがよくありますが、コーエンの効果サイズに相当するものは、「達成可能なもの」よりも何桁も大きい場合があります。
たとえば、観測値の90%(または30%のみ)が平均から1標準偏差内にある場合、それはまれであるか、まったく目立たないことです。 ?
ああ、標準偏差/分散のサイズについての議論をやめ、thについての議論を始めたことに注意してください。 e平均の1標準偏差内の観測値の割合、まったく異なる概念。非常に大まかに言えば、これは分布のピークに関連しています。
たとえば、分散をまったく変更せずに、平均の1sd以内の母集団の比率を非常に簡単に変更できます。母集団の分布が$ t_3 $の場合、その約94%が平均の1 sd以内にあり、一様分布の場合、約58%が平均の1sd以内にあります。ベータ($ \ frac18、\ frac18 $)分布では、約29%です。これは、すべてが同じ標準偏差を持っている場合、またはそれらのいずれかがパーセンテージを変更せずに大きくなったり小さくなったりした場合に発生する可能性があります。間隔を標準偏差で定義したため、実際にはスプレッドとはまったく関係ありません。
[1]:Cohen J.(1992)、
「パワープライマー」
PsycholBull。、 112 (1)、7月:155-9。
コメント
By Chebyshev “s不等式いくつかの$ x $が平均から$ k $×$ \ sigma $になる確率は、最大で$ \ frac {1} {k ^ 2} $:
$$であることがわかっています。 \ Pr(| X- \ mu | \ geq k \ sigma)\ leq \ frac {1} {k ^ 2} $$
ただし、いくつかの分布の仮定を行うと、より正確になります。近似により、 68–95–99.7ルールが導き出されます。通常、累積分布関数を使用して次のことができます。特定の割合のケースを含む間隔を選択します。ただし、信頼区間の幅の選択は、このスレッドで説明されているように主観的な決定です。
例
頭に浮かぶ最も直感的な例は、インテリジェンススケールです。インテリジェンスは直接測定できないものです。インテリジェンスの直接の「単位」はありません(ちなみに、センチメートルまたは摂氏度もどういうわけか恣意的です)。インテリジェンステストは、平均が100、標準偏差が15になるようにスコアが付けられます。平均と標準偏差がわかれば、どのスコアを「低」、「平均」、「高」と見なすことができるかを簡単に推測できます。ほとんどの人が得たスコア(たとえば50%)を「平均」として分類でき、高いスコアは「平均以上」に分類でき、まれに高いスコアは「優れた」などに分類できます。これは次の表に変換されます。 。
ウェクスラー(WAIS–III)1997 IQテスト分類IQ範囲(「偏差IQ」)
IQ Classification 130 and above Very superior 120–129 Superior 110–119 High average 90–109 Average 80–89 Low average 70–79 Borderline 69 and below Extremely low
(出典: https://en.wikipedia.org/wiki/IQ_classification )
したがって、標準偏差は、個々の値が平均からどれだけ離れていると想定できるかを示します。 $ \ sigma $は、平均からの単位のない距離と考えることができます。観測可能なスコア、たとえば知能テストのスコアについて考える場合、標準偏差を知ることで、ある値が平均からどれだけ離れているか($ \ sigma $ “sの数)、つまりそれがどれほど一般的か非一般的かを簡単に推測できます。主観的にいくつの$ \ sigma $ “が「遠い」と見なされますが、これは、平均から特定の距離にある値を観測する確率の観点から考えることで簡単に特定できます。
これは、次の場合に明らかです。分散($ \ sigma ^ 2 $)が何であるかを見てください
$$ \ operatorname {Var}(X)= \ operatorname {E} \ left [(X- \ mu)^ 2 \ right] 。 $$
… $ \ mu $からの$ X $ “sの予想される(平均)距離。不思議に思うなら、ここよりなぜそれが二乗されるのか。
コメント