Ik heb een vrij simpele vraag over de interpretatie van de F-test in Microsoft Excel.
Laten we zeggen dat dit de resultaten zijn van mijn F-test:
Ik vraag me nu af hoe ik het moet interpreteren om de juiste t-toets te kiezen (uitgaande van gelijke of ongelijke varianties) voor mijn dataset.
Ik heb gidsen gevonden die me vertellen of F critical> F, dan gebruik ongelijke varianties. Sommige handleidingen vertellen je echter om alleen de p-waarde te gebruiken, dus ik weet niet zeker naar welke parameters ik moet kijken bij het interpreteren van de resultaten.
Antwoord
Verschillende dingen:
1) Bij het doen van hypothesetests is de beslissing hetzelfde, of je nu p-waarden of kritische waarden gebruikt (als dat is het niet, je hebt iets verkeerd gedaan, of op zijn minst inconsistent).
2) Als de steekproefomvang gelijk is, is de t-test (of ANOVA) minder gevoelig voor verschillen rences in variantie.
3) Je moet geen formele test van gelijkheid van variantie doen om uit te vinden of je al dan niet gelijke varianties moet aannemen; de resulterende procedure voor het testen van gelijkheid van middelen heeft niet de eigenschappen die u waarschijnlijk zou wensen. Als u zich redelijkerwijs niet op uw gemak voelt met de aanname van gelijke variantie, haal het dan niet (als u wilt, neem aan dat de varianties altijd verschillend zijn, tenzij u een reden heeft om te denken dat ze redelijk dichtbij zullen komen). (en ANOVA) procedures zijn niet erg gevoelig voor kleine tot matige verschillen in populatievariantie, dus met gelijke (of bijna gelijke) steekproefgroottes moet u veilig zijn wanneer u er zeker van bent dat ze niet erg verschillend.
4) De “gebruikelijke” F-toets voor gelijkheid van variantie is extreem gevoelig voor niet-normaliteit . Als je de gelijkheid van variantie moet testen, zou het gebruik van die test niet mijn advies zijn.
Dat wil zeggen, als je een Welch-type test of iets dergelijks kunt doen, ben je misschien beter af gewoon om dat te doen. Het zal je nooit veel kosten, het kan veel besparen. (In uw specifieke situatie in dit geval bent u waarschijnlijk veilig genoeg zonder – maar er is geen specifieke reden om het niet te doen.)
Ik merk op dat R standaard de Welch-test gebruikt wanneer je probeert een t-test met twee steekproeven te doen; het doet alleen de versie met gelijke variantie als u het zegt. Ik denk dat dit de juiste manier is om het te doen (om het standaard veiliger te doen), al was het maar om ons van onszelf te redden.
Reacties
- Bedankt voor je antwoord, Glen_b. In i.imgur.com/evP3NPh.jpg is de F-kritieke waarde echter groter dan de F-waarde, wat me ertoe zou aanzetten om de t-test te gebruiken, uitgaande van ongelijk varianties, maar de p-waarde is groter dan 0,05, wat me ertoe zou aanzetten om de t-test te gebruiken, uitgaande van gelijke varianties. Daarom ben ik benieuwd hoe ik de resultaten moet interpreteren.
- Je ' vergist je opnieuw. De F kleiner hebben dan de kritieke waarde is n ' t, wat suggereert dat de varianties meer verschillen dan bij toeval. Je hebt dat precies achterwaarts (kun je verwijzen naar de gidsen die dat zeggen?). Vandaar mijn eerdere opmerking: " de beslissing is hetzelfde, of je nu p-waarden of kritische waarden gebruikt (als het niet ' t, je hebt iets verkeerd gedaan …) ". De directe implicatie is dat u iets verkeerd had gedaan. Maar gezien mijn andere opmerkingen, is het ' volkomen betwistbaar. De oefening is in ieder geval een slecht idee.
- Geen probleem, hier is een van de bronnen: chemistry.depaul.edu/wwolbach/390_490/Excel / …
- Ok, ik denk dat ik het nu begrijp. Dit F-kritische > F-ding werkt alleen als p < 0.05, anders kunnen we zeggen dat de steekproeven gelijke varianties hebben?
- Ik denk dat je ' het niet begrijpt. Als $ F < F _ {\ mathrm {crit}} $ dan automatisch $ p > 0,05 $. Dienovereenkomstig, als $ F \ geq F _ {\ mathrm {crit}} $ dan automatisch $ p \ leq 0.05 $. Als alternatief, als $ p \ leq 0.05 $ dan $ F \ geq F _ {\ mathrm {crit}} $ en als $ p > 0,05 $ dan $ F < F _ {\ mathrm {crit}} $. Verder kun je onder geen beding zeggen dat de twee populaties waaruit de steekproeven zijn getrokken, gelijke varianties hebben. Of de steekproeven zelf gelijke varianties hebben, kunt u zien aan de hand van de getallen – u hebt geen ' daarvoor een test nodig, maar als ze verschillen, hoeft dat niet ' vertel je niet veel interesses.
Antwoord
Als je meer wilt weten over de betekenis en berekening van de F-test bij gebruik als criterium voor de variantieanalyse (ANOVA) met voorbeelden in Excel beveel ik deze serie van vier artikelen aan.De uiteindelijke formule is in staat om rekening te houden met de grootte van alfa, het aantal vrijheidsgraden voor de teller en noemer van de F-ratio en de niet-concentraliteitsparameter.
- Het concept van statistische kracht – http://www.informit.com/articles/article.aspx?p=2036566
- De statistische kracht van t-tests – http://www.informit.com/articles/article.aspx?p=2036565
- De niet-concentratieparameter in de F-verdeling – http://www.informit.com/articles/article.aspx?p=2036567
- De kracht van de F-test berekenen – http://www.informit.com/articles/article.aspx?p=2036568
Antwoord
Belangrijk: zorg ervoor dat de variantie van variabele 1 hoger dan de variantie van variabele 2. Zo niet, wissel dan uw gegevens uit. Als resultaat berekent Excel de juiste F-waarde, de verhouding tussen Variantie 1 en Variantie 2 (F = Var1 / Var 2).
Conclusie: als F> F Critical one-tail, verwerpen we de nulhypothese de varianties van de twee populaties zijn ongelijk.