Lad os sige det på en eller anden måde $ 100 (1- \ alpha) \% $ konfidensinterval af befolkningens gennemsnit $ \ mu $ er kendt som $ (a, b) $ og antallet af prøver er $ n $ . Er det muligt at udlede punktestimater for befolkningsgennemsnit og befolkningsvarians fra disse oplysninger? I dette tilfælde antages det, at befolkningen følger normalfordeling.
En idé er, at fordi konfidensintervallet for populationsgennemsnittet kan beregnes, hvis vi kender eksemplets gennemsnit $ \ overline {x} $ og populationsvariansen $ \ sigma ^ {2} $ : $$ \ overline {x} -z _ {\ alpha / 2} \ frac { \ sigma} {\ sqrt {n}} \ leq \ mu \ leq \ overline {x} + z _ {\ alpha / 2} \ frac {\ sigma} {\ sqrt {n}} $$ , vi kan indstille $ a = \ overline {x} -z _ {\ alpha / 2} \ frac {\ sigma} {n} $ , $ b = \ overline {x} + z _ {\ alpha / 2} \ frac {\ sigma} {n} $ og løse $ \ overline {x} $ og $ \ sigma $ . Bestemt, i dette tilfælde kan $ \ overline {x} $ behandles som punktestimering af befolkningens gennemsnit. Hvad med $ \ sigma ^ {2} $ ? Er dette “ægte” populationsafvigelse, eller er dette bare “pointestimat” af populationsvarians? Jeg er virkelig forvirret over, hvordan $ \ sigma ^ {2} $ skal fortolkes i dette tilfælde.
Svar
Du kan udlede $ \ bar {x} $ og $ \ sigma ^ 2 $ der genererede dette konfidensinterval, ja. At kende prøvestørrelsen og $ \ alpha $ -niveau er imidlertid kritisk, og du kan ikke løse problemet uden disse oplysninger.
Z- baseret konfidensinterval indebærer en kendt varians, der bruges til at beregne konfidensintervallet, så når du bruger bredden til at løse varians, løser du den sande varians $ \ sigma ^ 2 $ , ikke et skøn $ s ^ 2 $ . Hvis konfidensintervallet er t-baseret, ville du løse for $ s ^ 2 $ .
Bredden af en z-baseret konfidens interval afhænger ikke af dataene, da du kender populationsvariansen. Når du kender en parameter, gider du ikke estimere den.
Kommentarer
- Hvis jeg forstod godt, ville svaret afhænge af, om konfidensintervallet blev afledt af z-baseret metode eller t-baseret metode. Tak for dit svar.
- Det er grunden til, at vi bruger z-baserede intervaller og t-baserede konfidensintervaller. Hvis vi kender populationsvariansen, vi gider ikke ' t med t-baserede konfidensintervaller, og det z-baserede interval har bredden bestemt af $ \ sigma ^ 2 / 2 $. Når vi ikke ' ikke kender populationsvariansen (stort set altid), estimerer vi befolkningsvariansen med $ s ^ 2 $ og bruger t-baserede konfidensintervaller til at tage højde for usikkerheden omkring estimatet (dvs. at tage højde for, at vores estimat måske er et dårligt estimat).