Jeg har en tredjeparts tilfældig talgenerator med en periode, der er omtrent større end $ 63 * (2 ^ {63} – 1) $, der genererer tal i området $ [0,2 ^ {32} -1] $, dvs. $ 2 ^ {32} $ forskellige numre. Jeg har foretaget nogle små ændringer og ønsker at kontrollere, at fordelingen forbliver ensartet. Jeg bruger Pearsons chi-squared test for tilpasning af en distribution, forhåbentlig korrekt uden at vide meget om det:

  1. Del $ 1000 * 2 ^ {32} $ observationer på tværs af $ 2 ^ {32} $ forskellige diskrete celler (jeg regner med, at antallet af observationer $ n $ skal være $ 5 * 2 ^ {32} \ lt n \ lt 63 * (2 ^ {63} – 1) $ eller $ 5 * \ text {interval} \ lt n \ lt \ text {periodicitet} $ ved hjælp af fem-eller-mere-reglen for at få anstændig tillid). Den forventede teoretiske frekvens $ E_i = 1000 * 2 ^ {32} / 2 ^ {32} = 1000 $.

  2. reduktionen i frihedsgrader er 1.

  3. $ x ^ 2 = \ sum_ {i = 0} ^ {2 ^ {32} -1} (O_i – E_i) ^ 2 / E_i $.

  4. frihedsgrader = $ 2 ^ {32} – 1 $.

  5. slå op p-værdien af en chi -squared ($ x ^ 2 $) fordeling givet $ 2 ^ {32} – 1 $ frihedsgrader.

    Så vidt jeg kan se, findes der ingen chi-kvadratfordeling for så mange frihedsgrader. Hvad skal jeg gøre?

  6. vælg en -tillid -værdighed $ c $, således at $ p > c $ betyder, at fordelingen sandsynligvis er ensartet. Jeg har en stor stikprøvestørrelse, men da jeg ikke er sikker på dens relation til p-værdi (øget sampling reducerer fejl, men signifikansværdien repræsenterer et forhold i de typer fejl), tror jeg, jeg bare holder fast med standardværdien 0,05.

Rediger: faktiske spørgsmål kursiveret ovenfor og opregnet nedenfor:

  1. Sådan får du en p -værdi?
  2. Hvordan vælges en betydningsværdi?

Rediger:

Jeg har stillet et opfølgningsspørgsmål på chi-squared goodness-of-fit: effektstørrelse og effekt .

Kommentarer

  • En chi-kvadratfordeling findes for enhver positiv frihedsgrad. Mener du " Jeg kan ' ikke finde tabeller til virkelig store df " eller " nogle funktion, jeg vil kalde, vandt ' t tager argumenter, der er store " eller noget andet? Bemærk at manglende afvisning af nul betyder ikke ' t af sig selv, at " fordelingen sandsynligvis er ensartet "
  • Jeg kan ' t finde tabeller til virkelig store df
  • Isn ' t er der lille forskel mellem de to? En p-værdi afspejler, hvor godt nullet passer, og selvom det ikke ' t antyder, at en anden hypotese ikke vinder ' t passer bedre, er dens pointe er at fremhæve observationer, som sandsynligvis ikke ' ikke passer til nul (men ikke nødvendigvis; kunne være en outlier). Så omvendt må jeg af praktiske hensyn antage, at alle andre observationer (undlader at afvise nul) antyder ", at fordelingen sandsynligvis er (dog ikke nødvendigvis; kunne være en outlier ) ensartet ".
  • I ' Jeg påpeger bare, at der ikke er en " måske " mellemgrund i en enten-eller-test, og hverken afvisning eller manglende afvisning antyder heller ikke, at der er nogen hypotese. Og ændring af konfidensniveauet ændrer bare forholdet mellem falske positive og falske negativer.
  • Hvis antallet af frihedsgrader er ' ' meget stor ' ' så kan $ \ chi ^ 2 $ tilnærmes med en normal tilfældig variabel.

Svar

En chi-firkant med store frihedsgrader $ \ nu $ er omtrent normal med gennemsnitlig $ \ nu $ og varians $ 2 \ nu $.

I dette tilfælde er ti milliarder frihedsgrader rigeligt; medmindre du er interesseret i høj nøjagtighed ved ekstreme p-værdier (meget langt fra 0,05), vil den normale tilnærmelse af chi-firkanten være fin.

Her er en sammenligning på kun $ \ nu = 2 ^ {12} $ – du kan se, at den normale tilnærmelse (stiplet blå kurve) næsten ikke skelnes fra chi-firkanten (solid mørkerød kurve).

indtast billedebeskrivelse her

Tilnærmelsen er langt bedre til meget større df.

Kommentarer

  • At ' en graf på $ x ^ 2 $ og ikke $ x $, ikke? Og med så små p-værdier, hvilket konfidensniveau skal jeg vælge?
  • Tegningen er simpelthen tætheden af et chi-kvadrat tilfældigt variat ($ X $), hvilken tæthed er en funktion af $ x $ .Du ' laver en hypotesetest, så du har ' ikke et konfidensniveau. Du har et signifikansniveau, men du vælger ikke ' at efter du ser en p-værdi, du vælger det inden du starter.
  • Ja, det er grafen for PDFen for $ x ^ 2_k $ -fordelingen. Med navnet Pearson ' s teststatistik ($ x ^ 2 $) var jeg ikke ' ikke sikker på, om $ x $ henviser til x-akse (i hvilket tilfælde skal jeg tage kvadratroden af statistikken først) eller distributionsnavnet (i hvilket tilfælde statistikken kortlægges direkte til aksen). Empirisk test af $ \ text {p-værdi} = 1 – CDF $ sammenlignet med tabeller bekræfter sidstnævnte.
  • P-værdien på $ x ^ 2_k $ beregnes via CDF ved hjælp af: $ 1 – \ frac {1} {\ Gamma (\ frac {k} {2})} * \ gamma (\ frac {k} {2}, \ frac {x} {2}) $, hvilket involverer beregning af en effektserie med ekstremt store antal.
  • Ved store k-værdier tilnærmer $ x ^ 2_k $ fordelingen normalfordelingen, så CDFen for den normale distribution bruges: $ 1 – \ frac {1} {2} \ left [1 + \ text {erf $ \ left (\ frac {x – k} {2 * \ sqrt {k}} \ right) $} \ right ] $ som beskrevet af svaret ($ \ sigma $ og $ \ mu $ erstattet efter behov). Dette involverer også beregning af en strømserie , selvom der er mindre tal involveret, og erf er en standardkomponent i mange standardbiblioteker.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *