Předpokládejme, že si můžeme vybrat ze dvou různých katalyzátorů. Z prvního se odebírá 10 pozorování a z druhého 12 pozorování. Pokud $ s_1 = 14 $ a $ s_2 = 28 $, můžeme na $ \ alpha = 5 \% $ odmítnout hypotézu, že rozdíly jsou stejné?

Zde je to, co udělal učitel:

Poměr je: $ s_1 / s_2 = 0,5. $

Potom

$$ P (F_ {n = 9, m = 11} \ le 0,5) = 0,1538 $$

Pak říká: p-hodnota je $ 2 \ krát \ min (0,1539; 0,8461) = 0,3074 $ a odmítá $ H_0 $.

Jak získám 0,1538?

Myslím, že mohu zkontrolovat F-tabulku pro n = 9, m = 11, ale co mám dělat, abych získal pravděpodobnost, že tato hodnota je $ \ le 0,5 $?

Komentáře

  • Opravil jsem spoustu zjevných typografických chyb. Zkontrolujte prosím otázku a opravte případná nedorozumění, která jsem mohl uvést. Díky statistikám, které zadáte, by $ H_0 $ nemělo být zamítnuto .
  • Záleží na tom, jak rozsáhlé jsou vaše F tabulky a jak ' znovu uspořádány. Alternativně můžete použít program, který má integrovaný cdf pro distribuci F. Například v R: pf(.5,9,11) dává odpověď [1] 0.1537596
  • @Glen_b, řekněme ', že máme F (.5,9,11). Říkáte, že v takové tabulce socr.ucla.edu/applets.dir/f_table.html předpokládám nalezení správné dílčí tabulky , a poté se podívejte na n = 9 am = 11 a odtud získejte pravděpodobnost. Správně?
  • Co tam máte, je tabulka kritických hodnot. Poskytuje pouze ocasní plochy až 10%; můžete použít vlastnosti F k nalezení nižších hodnot ocasu, ale největší jednostranná p-hodnota, kterou můžete z této sady tabulek získat, bude 10%. Vše, co ' d můžete říci, je " > 0,1 " spíše než " = 0,1538 "
  • ok. Pojďme ' předstírat, že z toho zítra dělám zkoušku. Jak získám svoji hodnotu P v otázce F-testu bez počítače?

Odpověď

První věc, kterou si všimnete, je to, že se jedná o test rozptylu, můžete mít F, které jsou buď velké nebo malé, které jsou významné, zatímco F tabulky často předpokládají, že provádíte výpočty typu ANOVA (kde mohou být pouze velké hodnoty F způsobit odmítnutí).

Musíte tedy využít skutečnosti, že dolní ocas $ F (\ nu_1, \ nu_2) $ je stejný jako převrácená hodnota horního ocasu $ F (\ nu_2, \ nu_1 ) $.

O tom se zde diskutuje více

Jak zjistím, ve kterém ocasu jsem? – Medián F-distribuce v případech, kdy si budete muset dělat starosti s testem odchylky být blízko 1. Takže pokud je F-statistika menší než 1, předpokládejme, že potřebujete dolní ocas. Pokud je větší než 1, předpokládejme, že potřebujete horní ocas.

V numerickém příkladu vaší otázky F = 0,5 – chcete dolní ocas pro F.

Abyste to zjistili, musíte vyměnit stupně volnosti a všechny hodnoty F budou inverzemi těch, které potřebujete. Jelikož potřebujete oblast pod 0,5, je to stejné jako najít oblast výše 1 / 0,5 = 2 na $ F_ {11,9} $.

Nejprve si tedy musíte dělat starosti s nejvyšším $ \ alpha $, které najdete (0,1 v uvedených tabulkách) ).

Jelikož tabulky, které jste propojili, mají na sloupcích df1, musíte v tomto případě najít sloupec 11 a řádek 9.

Nemáte 11, takže se podívejme na 10 a 12:

 ... 10 12 ⁞ 9 2.41632 2.37888 

Jak se tedy vypořádáte s skutečnost, že tu není číslo 11?

Nejprve si všimněte, že pokud je df2 alespoň 3 (a bude to pro test rozptylu při zkoušce), tabulka kritických hodnot se sníží protože buď df narůstá

Takže pokud jsme právě dostali dolní mez hodnoty p, podívejme se na další nižší df (tj. v tomto případě porovnej s df1 = 10).

[Více přesnosti naleznete v tomto příspěvku o interpolaci, která pojednává o interpolaci ve stupních volnosti pro F ke konci. Pokud se váš test blíží, pochybuji, že máte čas naučit se něco víc než lineární interpolaci. To naznačuje lineární interpolaci v převrácené hodnotě stupňů volnosti.]

Hodnota df1 10, df2 = 9 je 2,41632, což je větší hodnota než vaše 2. Takže vy „je blíže 1 než hodnota 0,1.

Což znamená, že vaše nižší hodnota p je> 0,1


Co kdyby problém byl podobný problému v otázce, ale hodnota F byla 0,4 $ místo 0,5 $?

1 / 0,4 = 2,5, což znamená, že je to dále do ocasu než dvě výše uvedené hodnoty 0,10 (2,41632, 2,37888). Takže p < 0,10 dolního ocasu.

Nyní porovnejte s 5% hodnotami. Vidíme, že je to méně než hodnoty 12,9 a 10,9 (které jsou těsně nad 3). Takže dolní ocas p> 0,05. Takže 0,05 $ < p < 0,10 $.

Co když byl problém podobný problému v otázce, ale F byl mezi hodnoty pro 10 a 12?

Nyní řekněme, že poměr F byl 0,323.

To je mezi hodnotou 0,05 pro 10,9 a 12,9 df – tak je p < 0,05 nebo> 0,05?

Možnost 1: řekněte, že je to přibližně 0,05.

Možnost 2: je řekněme, že musí být alespoň další menší (p> 0,025)

Možnost 3: použijte interpolaci (ale tentokrát na úrovni významnosti, ne na df), jak je popsáno na interpolačním odkazu, který jsem uvedl dříve. To naznačuje lineární interpolaci v $ \ log \ alpha $.

Osobně, kdybych byl někdy posedlý udělat F-test odchylek v praxi *, přesto jsem nějak nemohl přistupovat ani k kalkulačce (pomocí které rychlou numerickou integraci), zvolím možnost 3. Pokud bych to z nějakého důvodu nemohl udělat, zvolil bych možnost 1. Očekávání osoby, která ji označuje, by však mohla být možnost 2.

* Kdybych užíval silné halucinogeny, nebo jsem utrpěl těžké poranění hlavy, nebo nějaký jiný incident, který by mi nějak nedovolil ocenit, jaký by to byl opravdu špatný nápad.


Dvě sledované p-hodnoty

Zdá se, že je zamýšleno, že pouze zdvojnásobíte jednostranné p-hodnoty, abyste získali dvoustranné.

To je v pořádku pokud to jde, tak se toho jen držte, ale pokud jde o diskusi o některých problémech podrobněji, přečtěte si diskusi v příkladu na konci odpovědi zde

[Může přidat další podrobnosti později]

Odpověď

Nejprve F statistika není poměr standardních devs. Je to poměr odchylek. Takže F je 196/784 = 0,25. Hodnota p by pak byla 0,047.

Odpověď

Pokud potřebujete duální hodnotu p, můžete použít:

$$ P- hodnota = 2 min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$

kde:

$ F_0 = {S_1 ^ 2 \ přes S_2 ^ 2} $

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *