Je fais une régression dans Excel et jai des variables fictives pour Quarter (valeurs saisonnières) Les valeurs P pour Q2 et Q3 sont significatives mais ma valeur Q1 P semble aussi haut. Je ne peux pas exactement sortir Q1 … Que dois-je faire?

Voici ma sortie.

Intercept Pvalue 1.3208E-08 PRD1 Pvalue .00002834 Q1 Pvalue .6863222747 <-- this one concerns me Q2 Pvalue 6.22284E-06 Q3 Pvalue 1.22817E-07 PRD2 Pvalue 0.115615524 

Commentaires

  • Cela peut être évident pour quelquun avec plus de connaissances, mais si mon utilisateur de cette sortie affiche une prévision pour le premier trimestre ' t-il inutile, ou mal au mieux? Vous pouvez ' laisser le coefficient ' basé sur des éléments avec des valeurs P élevées? Aidez-moi Je ne sais pas comment gérer ces types de problèmes.
  • Vous vous demandez si l’inclusion d’un élément avec une valeur P élevée détruit tout le modèle de régression? Habituellement, je lance à nouveau la régression sans qu’un élément ne tire un valeur P élevée mais dans ce cas, ' s Q1 et je peux ' avoir exactement Q2 3 et 4 sans Q1 .. ~ confus
  • Ceci nest ' hors-sujet, mais pourrait être une copie de ??? quelque chose?
  • Il doit être là, mais quelquun dautre ha ve faire la recherche car maintenant il est trop tard dans la nuit ici. Mais le problème est que les variables fictives pour différents trimestres constituent vraiment ensemble une variable (dans ce cas avec quatre valeurs possibles, vous avez donc besoin de trois variables fictives pour la représenter. Ces trois variables factices constituent ensemble la variable (En R ces variables sont appelées " facteurs ". Vous ne devriez pas regarder les valeurs t individuelles pour chaque coefficient, mais construire un test F pour la variable complète (qui aura trois degrés de liberté).
  • Les facteurs, comme les quarts ici, doivent toujours être traités comme une totalité. Laissez-le avec toutes ses variables, ou laissez-le complètement. lun des coefficients individuels est non significatif est un non-problème

Réponse

Pour répondre à votre question principale: Si nous interprétons cette sortie signifie que leffet du mannequin Q1 nest pas significativement différent de 0, tout ce que cela signifie est que leffet dans Q1 est fondamentalement le même que dans Q4, qui est votre référence Catégorie. Il ny a donc que des preuves solides de limportance de la valeur fictive pour Q2 et Q3.

Dans un commentaire, vous écrivez

Vous vous demandez si l’inclusion d’un élément avec une valeur P élevée détruit tout le modèle de régression? Habituellement, je lance à nouveau la régression sans qu’un élément ne tire une valeur P élevée, mais dans ce cas, c’est Q1 et je ne peux pas avoir exactement Q2 3 et 4 sans Q1 .. ~ confus

Ce nest pas génial. Si vous souhaitez savoir si certains prédicteurs, le cas échéant, sont utiles pour prédire certains résultats, un bon point de départ est dutiliser des outils tels que le lasso ou la régression nette élastique. Ces méthodes adaptent à vos données un modèle pénalisé qui filtre les mauvais prédicteurs sans rencontrant plusieurs problèmes de comparaison. Ces sujets sont abordés en détail ailleurs sur ce site.

Commentaires

  • " ce nest pas ' t génial " signifiant Q1 dans mon modèle nest pas ' t super? Le seul outil dont nous disposons est Excel avec le plugin danalyse de régression VBA toolpak. Cela étant dit, le coefficient pour Q1 est n ' t 0 donc si je permets à mes utilisateurs de sélectionner Q1, il le sera prévoir quelque chose de différent que si mes utilisateurs prévoyaient pour le quatrième trimestre. Je voulais donc autoriser cela, car je sais que la valeur P est si élevée pour le premier trimestre.
  • " Différent " nest pas ' ça veut dire faux.
  • mais le changement qui le rend " différent " est piloté par une entrée avec une valeur P très élevée. Il semble que je ne devrais pas ' permettre que cela affecte les prévisions. Cest ' essentiellement toute ma question. Sur la base de vos commentaires, je suppose que je ne devrais pas ' men soucier, mais je ne suis pas tout à fait sûr de comprendre pourquoi.
  • Vous devriez essayer de comprendre, mais au moins, ne vous inquiétez pas! Votre inquiétude sans compréhension ne fera quempirer les choses.
  • @JohnsonJason, La suggestion dutiliser LASSO ou un filet élastique est bien dans le cas où lobjectif est la prédiction . Cependant, notez que la modélisation explicative et la modélisation prédictive résolvent des problèmes différents; un bel aperçu est donné dans Shmueli " Expliquer ou Prédire " (2010). Puisque lOP ne le rend pas explicite, je pense que je devrais le noter.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *