O que significa o tamanho do desvio padrão? [duplicar]

Esta questão já tem respostas aqui :

Comentários

Eu gostaria de sugerir que uma visão considerável dessas questões pode ser obtida substituindo " variância " ou " desvio padrão " por alguma outra quantidade (mais familiar) que desempenha um papel análogo na descrição quantitativa, como comprimento. Ao descrever a maioria dos objetos físicos, os cientistas relatam um comprimento. O que o comprimento realmente significa? Qual comprimento é considerado incomumente grande ou pequeno? Existem diretrizes para avaliar as magnitudes dos comprimentos? Se o comprimento for 90 (ou 30), isso é incomum ou completamente normal?
@whuber Como você pode ver, eu tentei o que você sugeriu na segunda revisão da minha pergunta, à qual glen_b respondeu que nenhum significado pode ser derivado disso. Já que seu comentário está sendo continuamente votado a favor, talvez você ou alguns dos votantes possam explicar o que seu comentário significa, onde eu errei (com minha segunda revisão) ou onde glen_b pode estar errado. Da forma como está, seu comentário não fornece nenhuma percepção para mim. Além disso, por favor, considere a revisão atual (esperançosamente final) da minha pergunta, onde eu tentei expressar minha pergunta sem nenhum dos exemplos obviamente perturbadores.
O que está faltando nesta pergunta e meu comentário é qualquer indicação das unidades de medida. " 90 " por si só não tem sentido. Outro elemento crucial que falta é qualquer quadro de referência contextual para determinar se 90 é grande ou pequeno.
Você está me conduzindo em círculos. Tive unidades de medida e contextos nos exemplos das versões anteriores da minha pergunta. Estes foram fortemente criticados. Obviamente, não consigo encontrar exemplos apropriados e chegar a uma conclusão sozinho. Peço explicitamente a você (ou a qualquer outra pessoa) que dê um exemplo e me explique a resposta.
Uma revisão de sua postagem original mostra que você estava fazendo esta pergunta com grande generalidade: " Existem diretrizes para avaliar a magnitude da variação nos dados? " Se este fosse (digamos) o site de Física e alguém perguntasse " existem diretrizes para avaliar a magnitude do comprimento, " não ' o que você acha a questão seria imediatamente encerrada como sendo muito ampla (ou muito vaga ou ambos)? Eu só esperava que essa analogia tornasse aparente o quão impossível é responder a sua pergunta aqui.

Resposta

Discussão da nova questão:

Por exemplo, se eu quiser estudar o tamanho do corpo humano e descobrir que o tamanho do corpo humano adulto tem um padrão desvio de 2 cm, eu provavelmente inferiria que o tamanho do corpo humano adulto é muito uniforme

Depende do que estamos comparando. Qual é o padrão de comparação que torna isso muito uniforme? Se você comparar com a variabilidade nos comprimentos de parafuso para um tipo específico de parafuso, isso pode ser extremamente variável.

enquanto um desvio padrão de 2 cm no o tamanho dos ratos significaria que os ratos diferem surpreendentemente muito no tamanho do corpo.

Em comparação com a mesma coisa em seu exemplo humano mais uniforme, certamente; quando se trata de comprimentos de coisas, que só podem ser positivos, provavelmente faz mais sentido comparar o coeficiente de variação (como apontei na minha resposta original), que é a mesma coisa que comparar sd para significar que você está sugerindo aqui .

Obviamente, o significado do desvio padrão é sua relação com a média,

Não, nem sempre. No caso de tamanhos de coisas ou quantidades de coisas (por exemplo, tonelagem de carvão, volume de dinheiro), isso geralmente faz sentido, mas em outros contextos, não faz sentido comparar com a média.

Mesmo assim, eles não são necessariamente comparáveis de uma coisa a outra. Não há um padrão aplicável a todas as coisas quão variável algo é antes de ser variável.

e um desvio padrão em torno de um décimo da média não é digno de nota (por exemplo, para IQ: SD = 0,15 * M).

O que estamos comparando aqui? Comprimentos a IQ “s ? Por que faz sentido comparar um conjunto de coisas com outro? Observe que a escolha da média 100 e dp 15 para um tipo de teste de QI é totalmente arbitrária. Eles não têm unidades. Poderia facilmente ter sido a média 0 dp 1 ou a média 0.5 e sd 0.1.

Mas o que é considerado “pequeno” e o que é “grande”, quando se trata da relação entre o desvio padrão e a média?

Já abordado em minha resposta original, mas abordado de forma mais eloquente no comentário de whuber – não há um padrão e não pode “t ser.

Alguns dos meus pontos sobre Cohen ainda se aplicam a este caso (sd em relação à média é pelo menos livre de unidades); mas mesmo com algo como, digamos, Cohen s d, um padrão adequado em um contexto não é necessariamente adequado em outro.

Respostas para uma versão anterior

Sempre calculamos e relatamos médias e desvios-padrão.

Bem, talvez na maior parte do tempo; Não sei se sempre faço isso. Há casos em que não é tão relevante.

Mas o que o tamanho da variação realmente significa?

O desvio padrão é uma espécie de distância média * da média. A variação é o quadrado do desvio padrão. O desvio padrão é medido nas mesmas unidades que os dados; a variação é em unidades quadradas.

* (RMS – https://en.wikipedia.org/wiki/Root_mean_square )

Eles dizem algo sobre como os dados estão” espalhados “(ou a distribuição, no caso de você” estar calculando o desvio ou variância de uma distribuição).

Por exemplo, suponha que estamos observando qual assento as pessoas ocupam em uma sala vazia. Se observarmos que a maioria das pessoas se senta perto da janela com pouca variação,

Esse “não é exatamente o caso de registrar” qual assento “, mas registrar “distância da janela”. (Saber “a maioria se senta perto da janela” não diz necessariamente nada sobre a média, nem a variação sobre a média. O que isso indica é que a mediana a distância da janela deve ser pequena.)

podemos presumir que isso significa que as pessoas geralmente preferem sentar perto da janela e obter uma visão ou luz suficiente é o principal fator motivador na escolha de um assento.

O fato de a mediana ser pequena não indica isso por si só. Você pode inferir a partir de outras considerações, mas pode haver todo tipo de razões para que não podemos de forma alguma discernir a partir dos dados.

Se, por outro lado, observarmos que, embora a maior proporção se situe perto da janela há uma grande variação com outros lugares ocupados com frequência (por exemplo, muitos sentam perto da porta, outros sentam perto do bebedouro ou dos jornais), podemos supor que, embora muitas pessoas prefiram sentar perto da janela, parece que ser mais fatores do que luz ou visão que influenciam a escolha de assento e preferências diferentes em pessoas diferentes.

Novamente, você está trazendo informações fora dos dados; pode ser aplicável ou não. Pelo que sabemos, a luz é melhor longe da janela, porque o dia está nublado ou as cortinas estão fechadas.

Em quais valores c e dizemos que o comportamento que observamos é muito variado (pessoas diferentes gostam de se sentar em lugares diferentes)?

O que torna um desvio padrão grande ou pequeno não é determinado por algum padrão externo, mas por considerações do assunto e, até certo ponto, pelo que você está fazendo com os dados e até mesmo fatores pessoais.

No entanto, com medições positivas, como distâncias, às vezes é relevante considerar o desvio padrão em relação à média (o coeficiente de variação); ainda é arbitrário, mas as distribuições com coeficientes de variação muito menores do que 1 (desvio padrão muito menor do que a média) são “diferentes” em algum sentido do que aquelas em que é muito maior do que 1 (desvio padrão muito maior do que a média , que geralmente tende a ser fortemente inclinado para a direita).

E quando podemos inferir que o comportamento é basicamente uniforme (todo mundo gosta de se sentar à janela)

Tenha cuidado ao usar a palavra “uniforme” nesse sentido, uma vez que “é fácil interpretar mal o seu significado (por exemplo, se eu disser que as pessoas são” uniformemente sentado na sala “isso significa quase o oposto do que você quer dizer). De maneira mais geral, ao discutir estatísticas, evite usar termos de jargão em seu sentido comum.

e a pequena variação que nossos dados mostram é principalmente o resultado de efeitos aleatórios ou variáveis de confusão (sujeira em uma cadeira, o sol se moveu e mais sombra nas costas, etc.)?

Não, novamente, você está trazendo informações externas para a quantidade estatística que está discutindo. A variância não indica tal coisa.

Existem diretrizes para avaliar a magnitude da variação nos dados, semelhantes às diretrizes de Cohen para interpretar o tamanho do efeito (uma correlação de 0,5 é grande, 0,3 é moderado e 0,1 é pequeno)?

Não em geral, não.

Cohen “s a discussão [1] de tamanhos de efeito é mais sutil e situacional do que você indica; ele dá uma tabela de 8 valores diferentes de pequeno, médio e grande, dependendo do tipo de coisa que está sendo discutida. Esses números que você dá se aplicam a diferenças em meios independentes (Cohen “s d).
Os tamanhos de efeito de Cohen” são todos escalados para serem quantidades sem unidade . O desvio padrão e a variância não são – mude as unidades e ambos mudarão.
Os tamanhos de efeito de Cohen se destinam a ser aplicados em uma área de aplicação particular (e mesmo assim eu considero muito foco naqueles padrões do que é pequeno, médio e grande como algo arbitrário e um pouco mais prescritivo do que eu gostaria). Eles são mais ou menos razoáveis para a área de aplicação pretendida, mas podem ser totalmente inadequados em outras áreas (a física de alta energia, por exemplo, frequentemente requer efeitos que cobrem muitos erros padrão, mas os equivalentes dos tamanhos de efeito de Cohens podem ser muitas ordens de magnitude a mais do que o que é atingível).

Por exemplo, se 90% (ou apenas 30%) das observações se enquadram em um desvio padrão da média, isso é incomum ou completamente normal ?

Ah, observe agora que você parou de discutir o tamanho do desvio padrão / variância e começou a discutir isso A proporção de observações dentro de um desvio padrão da média, um conceito totalmente diferente. Grosso modo, isso está mais relacionado ao pico da distribuição.

Por exemplo, sem alterar a variância, posso alterar a proporção de uma população dentro de 1 sd da média com bastante facilidade. Se a população tem uma distribuição $ t_3 $, cerca de 94% dela está dentro de 1 sd da média; se ela tem uma distribuição uniforme, cerca de 58% está dentro de 1 sd da média; e com uma distribuição beta ($ \ frac18, \ frac18 $), é cerca de 29%; isso pode acontecer com todos eles tendo os mesmos desvios padrão, ou com qualquer um deles sendo maior ou menor sem alterar essas porcentagens – não está realmente relacionado à propagação, porque você definiu o intervalo em termos de desvio padrão.

[1]: Cohen J. (1992),
“A power primer,”
Psychol Bull. , 112 (1), julho: 155-9.

Comentários

Se a distribuição for idêntica, a porcentagem será fixa, não mudando.
Se as coisas funcionarem como deveriam, você não ' conseguirá excluí-lo; enquanto você " possui " sua pergunta, uma vez que uma pergunta tenha respostas, você não ' não posso excluí-los, então a pergunta – uma pergunta válida com respostas válidas – deve permanecer, mesmo que ' não seja o que você queria perguntar . Eu ' d sugiro que você comece sua nova pergunta com alguns conceitos básicos; você pode descobrir que muitas de suas intuições atuais não ' se aplicam.
É ' uma questão mais clara e seria foi uma boa pergunta. Infelizmente, o problema é que você ' mudou drasticamente a pergunta de uma forma que invalida as respostas que recebeu (a outra completamente completamente, a minha parcialmente). Por que não deveria simplesmente ser revertido para o estado em que estava quando obteve essas respostas?
No entanto, em vez de remover o que você tinha antes, você pode adicionar sua pergunta revisada no final e deixar o original para contexto, de modo que a outra resposta ainda pareça responder a uma pergunta. É ' dificilmente justo colocar Tim ' s resposta originalmente válida em risco de ser marcada como " não é uma resposta " (e depois excluída) quando sua resposta respondia a uma parte importante do que você perguntou originalmente. A maneira fácil é copiar o que você tem agora (para, digamos, uma janela do bloco de notas), reverter sua pergunta e, em seguida, editar para repassar no novo conteúdo (e adicionar qualquer explicação da mudança que você achar necessária).
(a), não, a comparação com ratos veio mais tarde na discussão. Na época em que você o chamou de " muito uniforme ", nenhuma menção a ratos havia sido feita. (b) Não, não há ' s nenhuma relação entre a média e o dp para distribuições normais em geral; o normal é uma família em escala de localização. Existem, por exemplo, distribuições exponenciais. …(ctd)

Resposta

Por Chebyshev “s desigualdade sabemos que a probabilidade de algum $ x $ ser $ k $ vezes $ \ sigma $ da média é no máximo $ \ frac {1} {k ^ 2} $:

$$ \ Pr (| X- \ mu | \ geq k \ sigma) \ leq \ frac {1} {k ^ 2} $$

No entanto, ao fazer algumas suposições de distribuição, você pode ser mais preciso, por exemplo, Normal aproximação leva à regra 68-95-99,7 . Geralmente, usando qualquer função de distribuição cumulativa , você pode escolha algum intervalo que deve abranger uma certa porcentagem de casos. No entanto, escolher a largura do intervalo de confiança é uma decisão subjetiva, conforme discutido neste tópico .

Exemplo
O exemplo mais intuitivo que me vem à mente é a escala de inteligência . Inteligência é algo que não pode ser medido diretamente, nós não têm “unidades” diretas de inteligência (aliás, centímetros ou graus Celsius também são de alguma forma arbitrários). Os testes de inteligência são pontuados de forma que tenham média de 100 e desvio padrão de 15. O que isso nos diz? Conhecendo a média e o desvio padrão, podemos facilmente inferir quais pontuações podem ser consideradas “baixas”, “médias” ou “altas”. Como “média”, podemos classificar as pontuações obtidas pela maioria das pessoas (digamos 50%), pontuações mais altas podem ser classificadas como “acima da média”, pontuações excepcionalmente altas podem ser classificadas como “superiores” etc., isso se traduz na tabela abaixo .

Wechsler (WAIS – III) Classificação do teste de QI de 1997 Intervalo de QI (“desvio IQ”)
IQ Classification 130 and above Very superior 120–129 Superior 110–119 High average 90–109 Average 80–89 Low average 70–79 Borderline 69 and below Extremely low 
(Fonte: https://en.wikipedia.org/wiki/IQ_classification )

Portanto, o desvio padrão nos diz até que ponto podemos supor que os valores individuais estão distantes da média. Você pode pensar em $ \ sigma $ como uma distância sem unidade da média. Se você pensar em pontuações observáveis, digamos pontuações de testes de inteligência, então saber os desvios padrão permite que você facilmente inferir a que distância (quantos $ \ sigma $ “s) algum valor está da média e quão comum ou incomum ele é. subjetivo quantos $ \ sigma $ “s se qualificam como” longe “, mas isso pode ser facilmente qualificado pensando em termos de probabilidade de valores observados a uma certa distância da média.

Isso é óbvio se você veja qual variância ($ \ sigma ^ 2 $) é

$$ \ operatorname {Var} (X) = \ operatorname {E} \ left [(X – \ mu) ^ 2 \ right] . $$

… a distância esperada (média) de $ X $ “s de $ \ mu $. Se você se pergunta, então pode ler por que está ao quadrado .

Comentários

Sua interpretação da média requer normalidade. O QI não é distribuído normalmente (as caudas são mais espessa e a curva é enviesada). Portanto, a regra dos 3 sigma não se aplica. Além disso, sua interpretação é circular, porque a classificação de QI é baseada aleatoriamente no SD e não pode, por sua vez, explicar o SD.

Comentários

Resposta

Comentários

Resposta

Comentários

Deixe uma resposta Cancelar resposta