Stel dat we kunnen kiezen uit twee verschillende katalysatoren. 10 waarnemingen zijn genomen van de eerste en 12 van de andere. Als $ s_1 = 14 $ en $ s_2 = 28 $, kunnen we dan bij $ \ alpha = 5 \% $ de hypothese verwerpen dat de varianties gelijk zijn?

Dit is wat de leraar deed:

De verhouding is: $ s_1 / s_2 = 0,5. $

Dan

$$ P (F_ {n = 9, m = 11} \ le 0.5) = 0.1538 $$

Dan zegt hij: de p-waarde is $ 2 \ times \ min (0.1539; 0.8461) = 0.3074 $ en hij wijst $ H_0 $ af.

Hoe kom ik aan de 0.1538?

Ik denk dat ik een F-tabel kan controleren op n = 9, m = 11, maar wat moet ik dan doen om de kans te krijgen dat deze waarde $ \ le 0.5 $ is?

Reacties

  • Ik heb heel wat gerepareerd van schijnbare typografische fouten. Controleer de vraag en corrigeer eventuele misverstanden die ik heb geïntroduceerd. Met de statistieken die u opgeeft, mag $ H_0 $ niet worden afgewezen.
  • Het hangt af van hoe uitgebreid uw F-tabellen zijn en hoe ze ' opnieuw gerangschikt. Je kunt ook een programma gebruiken waarin de cdf voor de F-distributie is ingebouwd. Bijvoorbeeld, in R: pf(.5,9,11) geeft het antwoord [1] 0.1537596
  • @Glen_b, laat ' s zeggen dat we F (.5,9,11) hebben. Wat u zegt, is dat ik veronderstel dat ik in een tabel als deze socr.ucla.edu/applets.dir/f_table.html de juiste subtabel moet vinden , en kijk dan naar n = 9 en m = 11 en haal daar de kans vandaan. Klopt?
  • Wat je daar hebt, is een tabel met kritische waarden. Het geeft slechts staartgebieden tot 10%; je kunt de eigenschappen van de F gebruiken om lagere staartwaarden te vinden, maar de grootste eenzijdige p-waarde die je uit die set tabellen kunt halen, is 10%. Alles wat je ' zou kunnen zeggen is " > 0,1 " in plaats van " = 0.1538 "
  • Ok. Laten we ' s doen alsof ik daar morgen een examen over doe. Hoe krijg ik mijn P-waarde in een F-toets-vraag, zonder computer?

Antwoord

Het eerste dat opvalt, is dat aangezien dit een variantie-test is, u F “s kunt hebben die ofwel groot of klein zijn, omdat ze significant zijn, terwijl F-tabellen er vaak van uitgaan dat u ANOVA-berekeningen uitvoert (waarbij alleen grote waarden van F kunnen afwijzing veroorzaken).

Je moet dus gebruik maken van het feit dat de onderste staart van $ F (\ nu_1, \ nu_2) $ hetzelfde is als het omgekeerde van de bovenste staart van $ F (\ nu_2, \ nu_1 ) $.

Er “een beetje meer discussie daarover hier

Hoe weet ik in welke staart ik me bevind? – De mediaan van een F-verdeling in de gevallen waar je je zorgen over moet maken voor een variantie-test zal dicht bij 1. Dus als de F-statistiek kleiner is dan 1, neem dan aan dat je de onderste staart nodig hebt. Als deze groter is dan 1, neem dan aan dat u de bovenste staart nodig heeft.

In het numerieke voorbeeld in uw vraag, F = 0,5 – u wilt een onderste staart voor F.

Dus om dat te vinden, moet je de vrijheidsgraden omwisselen, en de F-waarden zijn allemaal de inverse van degene die je nodig hebt. Aangezien je het gebied onder 0,5 nodig hebt, is het hetzelfde als het vinden van het gebied boven 1 / 0.5 = 2 op een $ F_ {11,9} $.

U moet zich dus eerst zorgen maken over de hoogste $ \ alpha $ die u kunt vinden (0,1 in de aangegeven tabellen ).

Aangezien de tabellen die je hebt gelinkt df1 op de kolommen hebben, moet je in dit geval de 11-kolom en de 9-rij vinden.

Je hebt geen 11, dus laten we eens kijken naar 10 en 12:

 ... 10 12 ⁞ 9 2.41632 2.37888 

Dus hoe ga je om met het feit dat er geen 11 is?

Merk allereerst op dat zolang df2 ten minste 3 is (en dat is voor een variantie-test in een examen), de tabel met kritische waarden afneemt als een van beide df toeneemt

Dus als we alleen maar een ondergrens voor de p-waarde krijgen, kijk dan naar de volgende lagere df (vergelijk in dit geval met df1 = 10).

[Voor meer nauwkeurigheid, zie dit bericht over interpolatie, waarin interpolatie in vrijheidsgraden voor de F tegen het einde wordt besproken. Als je test op de loer ligt, betwijfel ik of je tijd hebt om iets meer te leren dan lineaire interpolatie. Dat suggereert lineaire interpolatie in het omgekeerde van de vrijheidsgraden.]

De waarde bij df1 10, df2 = 9 is 2,41632 wat groter is dan je 2. Dus jij “re dichter bij 1 dan de 0,1-waarde.

Wat betekent dat uw lagere p-waarde> 0,1 is


Wat als het probleem vergelijkbaar was met het probleem in de vraag, maar de F was $ 0,4 $ in plaats van $ 0,5 $?

1 / 0,4 = 2,5, wat betekent dat het verder in de staart zit dan de twee waarden van 0,10 hierboven (2,41632, 2,37888). Dus de onderste p < 0.10.

Vergelijk nu met de 5% -waarden. We zien dat het “minder is dan zowel de 12,9- als de 10,9-waarde (die beide net boven de 3 liggen). Dus de onderste staart p> 0,05. Dus $ 0,05 < p < 0.10 $.

Wat als het probleem vergelijkbaar was met het probleem in de vraag, maar de F was ertussen de waarden voor 10 en 12?

Laten we nu zeggen dat de F-ratio 0,323 was.

Dit ligt tussen de 0,05 waarde voor 10,9 en 12,9 df – zo is p < 0,05 of> 0,05?

Mogelijkheid 1: zeg dat het ongeveer 0,05 is.

Mogelijkheid 2: is om zeg dat het tenminste de volgende kleinere moet (p> 0.025)

Mogelijkheid 3: gebruik interpolatie (maar deze keer in het significantieniveau, niet de df), zoals beschreven op de interpolatielink die ik eerder gaf. Dat suggereert lineaire interpolatie in $ \ log \ alpha $.

Persoonlijk, als ik ooit bezeten zou zijn geweest om een F-test van varianties in de praktijk * te doen, maar op de een of andere manier zelfs geen toegang tot een rekenmachine had (waarmee ik een snelle numerieke integratie), zou ik optie 3 kiezen. Als ik dat om de een of andere reden niet zou kunnen doen, zou ik optie 1 kiezen. De verwachtingen van de persoon die het markeert, zouden echter wel eens optie 2 kunnen zijn.

* als ik “krachtige hallucinogenen had gebruikt, of een ernstig hoofdtrauma had opgelopen, of een ander incident waardoor ik op de een of andere manier niet meer kon inzien wat een echt slecht idee dit waarschijnlijk zou zijn.


Tweezijdige p-waarden

Het lijkt erop dat het de bedoeling is dat u enkelzijdige p-waarden verdubbelt om tweezijdige p-waarden te verkrijgen.

Dat is prima voor zover het gaat, dus blijf daar gewoon bij, maar voor een bespreking van enkele van de problemen in meer detail, zie de bespreking in het voorbeeld aan het einde van het antwoord hier

[Mag later wat meer details toevoegen]

Antwoord

Ten eerste, de F statistiek is niet de verhouding van std devs. Het is de verhouding van varianties. Dus F is 196/784 = 0,25. De p-waarde zou dan 0,047 zijn.

Answer

Als je een tweezijdige p-waarde nodig hebt, kun je gebruiken:

$$ P- waarde = 2min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$

waar:

$ F_0 = {S_1 ^ 2 \ over S_2 ^ 2} $

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *