Je suis un étudiant en mathématiques passionné par la physique. Cela signifie que jai suivi des cours de deuxième cycle en dynamique quantique et relativité générale sans la majeure partie des cours de physique de premier cycle et un volume déducation sur les outils physiques et létat desprit que les autres étudiants qui ont suivi le cours avaient, comme le théorème de Noether, Lagrangian et la mécanique hamiltonienne, les méthodes statistiques, etc.
Les cours eux-mêmes se sont assez bien déroulés. Mon expérience mathématique a plus ou moins compensé un manque de compréhension physique. Cependant, je nai toujours pas trouvé dexplication élémentaire de linvariance de jauge (sil y a une telle chose). Je connais quelques exemples, comme la façon dont le potentiel magnétique nest unique que jusquà un (temps -) gradient constant. Je lai également rencontré en relativité générale linéarisée, où il y a plusieurs perturbations différentes de la métrique de lespace-temps qui donnent la même dynamique observable.
Cependant, pour vraiment comprendre ce qui se passe, Jaime avoir des exemples plus simples. Malheureusement, je nai pas pu en trouver. Je suppose que, comme « invariance de jauge » est une expression si effrayante, personne nutilise ce mot pour écrire à un lycéen.
Donc, mon ( très simple) est la suivante: dans de nombreux calculs de physique au lycée, vous mesurez ou calculez le temps, la distance, lénergie potentielle, la température et dautres quantités. Ces calculs ne dépendent très souvent que de la différence entre deux valeurs, pas les valeurs concrètes elles-mêmes. Vous êtes donc libre de choisir un zéro à votre guise. Sagit-il dun exemple dinvariance de jauge dans le même sens que les exemples avancés ci-dessus? Ou sagit-il de deux concepts différents?
Commentaires
- Si vous aimez cette question, vous pouvez également lire ce post Phys.SE.
- John Baez écrit : » Le principe de la jauge dit, en termes simples, que vous ne pouvez que le dire si deux particules sont dans le même état si vous les déplacez les uns à côté des autres pour pouvoir les comparer. Lélaboration des conséquences mathématiques de ce principe conduit à des théories de jauge qui expliquent les forces que nous voyons dans la nature. »
Réponse
La raison pour laquelle il est si difficile de comprendre ce que les physiciens veulent dire quand ils parlent de « liberté de jauge » est quil y a au moins quatre définitions inéquivalentes que j « ai vu utilisées :
-
Définition 1: Une théorie mathématique a une liberté de jauge si certains des degrés de liberté mathématiques sont « redondants » dans le sens où deux expressions mathématiques différentes décrivent exactement le même système physique . Alors les degrés de liberté redondants (ou « dépendant de la jauge ») sont « non physiques » en ce sens quaucune expérience possible ne pourrait déterminer uniquement leurs valeurs, même en principe. Un exemple célèbre est la phase globale dun état quantique – il est totalement impossible à mesurer et deux vecteurs dans lespace de Hilbert qui ne diffèrent que par une phase globale décrivent exactement le même état. Un autre exemple, comme vous lavez mentionné, est tout type de potentiel qui doit être différenciée pour produire une quantité physique – par exemple, une fonction dénergie potentielle (bien que certains de vos autres exemples, comme la température, ne soient pas des exemples de quantités dépendant de la jauge, car il y a un sens physique bien défini de la température zéro).
Pour les systèmes physiques décrits par des structures mathématiques avec une liberté de jauge, la meilleure façon de définir mathématiquement une configuration physique spécifique est de créer une classe déquivalence de fonctions dépendant de la jauge qui ne diffèrent que par leurs degrés de liberté de jauge Par exemple, en mécanique quantique, un état physique nest pas réellement décrit par un seul vecteur dans lespace de Hilbert, mais plutôt par une classe déquivalence de vecteurs qui diffèrent par un mul scalaire global. tiple. Ou plus simplement, par une ligne de vecteurs dans lespace de Hilbert. (Si vous voulez avoir de la fantaisie, lespace des états physiques est appelé un «espace de Hilbert projectif», qui est lensemble des lignes dans lespace de Hilbert, ou plus précisément une version de lespace de Hilbert dans laquelle les vecteurs sont identifiés sils sont proportionnels Je suppose que vous pourriez également définir les «énergies potentielles physiques» comme des ensembles de fonctions dénergie potentielle qui ne diffèrent que par une constante additive, bien quen pratique ce soit une sorte de surpuissance. Ces classes déquivalence suppriment la liberté de jauge par construction, et il en est de même pour les « invariants de jauge ».
Parfois (mais pas toujours) il existe « une opération mathématique simple qui supprime tous les degrés de liberté redondants tout en préservant tous les degrés physiques. Par exemple, étant donné une énergie potentielle, on peut prendre le gradient pour produire un champ de force, qui est directement mesurable.Et dans le cas du classique E & M, il existe certaines combinaisons linéaires de dérivées partielles qui réduisent les potentiels à $ {\ bf E} $ et $ {\ bf B} directement mesurables $ champs sans perdre aucune information physique. Cependant, dans le cas dun vecteur dans un espace quantique de Hilbert, il ny a pas dopération dérivée simple qui supprime la liberté de phase sans rien perdre dautre.
-
Définition 2: la même comme Définition 1, mais avec lexigence supplémentaire que les degrés de liberté redondants soient locaux . Cela signifie quil existe une sorte dopération mathématique qui dépend dun lissage arbitraire function $ \ lambda (x) $ sur lespace-temps qui laisse invariants les degrés de liberté physiques (cest-à-dire les quantités physiquement mesurables). Lexemple canonique est bien sûr que si vous prenez nimporte quelle fonction lisse $ \ lambda ( x) $, puis ajouter $ \ partial_ \ mu \ lambda (x) $ au quatre potentiels électromagnétiques $ A_ \ mu (x) $ laisse les quantités physiques (les $ {\ bf E} $ et $ {\ bf B } $ fields) inchangé (en théorie des champs, lexigence selon laquelle les «degrés de liberté physiques» ne sont pas modifiés est formulée comme exigeant que la densité lagrangienne $ \ mathcal {L} [\ varphi (x)] $ soit inchangée , mais dautres formulations sont possibles.) Cette définition est clairement beaucoup plus stricte – les exemples donnés ci-dessus dans la Définition 1 ne comptent pas dans cette définition – et la plupart du temps où les physiciens parlent de « liberté de jauge » cest la définition quils veulent dire. Dans ce cas, au lieu davoir juste quelques degrés de liberté redondants / non physiques (comme la constante globale de votre énergie potentielle), vous avez un nombre continuellement infini. (Pour rendre les choses encore plus confuses, certaines personnes utilisent lexpression «symétrie de jauge globale» au sens de la définition 1 pour décrire des choses comme la liberté de phase globale dun état quantique, ce qui serait clairement une contradiction dans les termes au sens de la définition 2.)
Il savère que pour traiter cela dans la théorie quantique des champs, vous devez changer substantiellement votre approche de la quantification (techniquement, vous devez « jauger fixer votre intégrale de chemin ») dans lordre pour éliminer tous les degrés de liberté non physiques. Lorsque les gens parlent de quantités «invariantes de jauge» sous cette définition, dans la pratique, ils désignent généralement les dérivés directement mesurables physiquement, comme le tenseur électromagnétique $ F _ {\ mu \ nu} $, qui restent inchangés («invariants») sous toute transformation de jauge . Mais techniquement, il existe également dautres quantités invariantes de jauge, par ex. une superposition quantique uniforme de $ A_ \ mu (x) + \ partial_ \ mu \ lambda (x) $ sur tout $ \ lambda (x) $ pour un $ A_ \ mu (x) particulier. $
Voir le billet de blog de Terry Tao pour une excellente explication de ce deuxième sens de symétrie de jauge dans une perspective plus mathématique.
-
Définition 3: On dit parfois quun lagrangien possède une « symétrie de jauge » sil existe une opération qui dépend dune fonction continue arbitraire sur lespace-temps qui le laisse invariant, même si les degrés de liberté sont modifiés sont physiquement mesurables.
-
Définition 4: Pour une «théorie de jauge de treillis» définie sur des hamiltoniens de treillis locaux, il existe un opérateur supporté sur chaque site de treillis qui fait la navette avec lhamiltonien. Dans certains cas, cet opérateur correspond à une quantité physiquement mesurable.
Les cas des définitions 3 et 4 sont un peu subtils sur le plan conceptuel, donc je nirai pas en eux ici – je peux les aborder dans un suivi -up question si quelquun est intéressé.
Mise à jour: Jai écrit des réponses de suivi concernant la question de savoir sil existe un sens dans lequel les degrés de liberté de jauge peuvent être physiquement mesurables dans le cas hamiltonien et le cas lagrangien .
Commentaires
- Excellente réponse! Cest lune des meilleures explications (en un seul endroit) que je connaisse encore !!!! : D
- Jai posé la question de suivi sur les subtilités entre # 3 et # 4
- physics.stackexchange.com/q/ 267175/122066
- @ user122066 Voir la mise à jour à la fin de ma réponse pour des liens vers mes suivis.
Réponse
Je nai compris cela quaprès avoir suivi un cours de relativité générale (GR), de géométrie différentielle et de théorie quantique des champs (QFT). Lessence est juste un changement de systèmes de coordonnées qui doit être reflété dans la dérivée. Je vais vous expliquer ce que je veux dire.
Vous avez une théorie qui est invariante sous un groupe de symétrie. Donc, en électrodynamique quantique, vous avez une densité lagrangienne pour les fermions (pas encore de photons) $$ \ mathcal L = \ bar \ psi (x) [\ mathrm i \ gamma ^ \ mu \ partial_ \ mu – m] \ psi (x) \,. $$ Cette $ \ bar \ psi $ est juste $ \ psi ^ \ dagger \ gamma ^ 0 $, limportant est quil soit conjugué complexe.Le fait quil sagisse dun quatre vecteurs dans lespace de spin nest pas préoccupant ici. Ce que lon peut faire maintenant, cest transformer $ \ psi \ en \ exp (\ mathrm i \ alpha) \ psi $ avec un peu de $ \ alpha \ in \ mathbb R $. Alors $ \ bar \ psi \ to \ bar \ psi \ exp (- \ mathrm i \ alpha) $ et le lagrangien sera invariant car le dérivé nagit pas sur la fonction exponentielle, cest juste un facteur de phase. Là, vous avez une symétrie globale.
Maintenant, promouvez la symétrie à une symétrie locale, pourquoi pas? Au lieu dun $ \ alpha $ global, on a maintenant $ \ alpha (x) $. Cela signifie que nous choisissons un $ \ alpha $ différent à chaque point de lespace-temps. Le problème est que lorsque nous transformons maintenant, on prend le $ \ partial_ \ mu \ alpha (x) $ avec la chaîne et les règles de différenciation du produit. Cela semble être une complication technique au début.
Il y a une manière plus révélatrice de voir ceci:
Vous prenez un dérivé dun champ $ \ psi (x) $. Cela signifie prendre un quotient de différence comme $$ \ partial_ \ mu \ psi (x) = \ lim _ {\ epsilon \ to 0} \ frac {\ psi (x + \ epsilon \ vec e_ \ mu) – \ psi (x) } {\ epsilon} \,. $$ Cela fonctionne très bien avec une transformation globale. Mais avec la transformation locale, vous soustrayez essentiellement deux valeurs qui sont évaluées différemment. En géométrie différentielle, vous avez que les espaces tangents aux différents points de la variété sont différents et donc on ne peut pas simplement comparer les vecteurs par leurs composants. Il faut une connexion avec des coefficients de connexion pour assurer le transport parallèle . Cest pareil ici. Nous avons maintenant promu $ \ phi $ de vivre sur $ \ mathbb R ^ 4 $ à vivre dans le bundle $ \ mathbb R ^ 4 \ times S ^ 1 $ car nous avons un groupe de jauge U (1). Par conséquent, nous avons besoin dune sorte de connexion pour transporter le $ \ phi $ transformé de $ x + \ epsilon \ vec e_ \ mu $ à $ x $. Cest là quil faut introduire une connexion qui est $$ \ partial_ \ mu \ to \ mathrm D_ \ mu: = \ partial_ \ mu + \ mathrm i A_ \ mu \,. $$
Si vous branchez cela dans la densité de Lagrange pour en faire $$ \ mathcal L = \ bar \ psi (x) [\ mathrm i \ gamma ^ \ mu \ mathrm D_ \ mu – m] \ psi (x) $$ puis choisissez $ A_ \ mu = \ partial_ \ mu \ alpha $ vous verrez que la densité lagrangienne reste invariante même sous des transformations locales car le coefficient de connexion soustrayera simplement le terme indésirable de la règle produit / chaîne.
En relativité générale, vous avez la symétrie sous difféomorphisme arbitraire, le prix est que vous devez changer le dérivé en une connexion, $$ \ partial \ to \ nabla: = \ partial + \ Gamma + \ cdots \,. $$
Réponse
Puisque vous avez mentionné venir dun fond de mathématiques, vous pourriez trouver agréable de prendre une réponse en termes de classes déquivalence.
Une théorie de jauge est une théorie physique où les quantités observables, comme dans les choses que vous pourriez mesurer avec une expérience avec un équipement de mesure parfait, sont des classes déquivalence dans un espace vectoriel.
Lélectromagnitisme est lexemple le plus courant. Les théories de la physique moderne sont toujours écrites comme des faisceaux de fibres où la variété sous-jacente est lespace-temps et les fibres sont un espace tangent associé à chaque point (appelé événement) dans lespace-temps. E & M dans lespace libre (pas de charges présentes) est décrit en associant un objet à 4 composants appelé $ A _ {\ mu} $ à chaque point de lespace-temps, $ x $, et nécessitant $ A _ {\ mu} (x) $ pour satisfaire les équations de maxwell.
Cependant, les quantités observables, tout aussi mesurables, dans la nature sont les champs électrique et magnétique, $ \ vec {E} (x) $ et $ \ vec {B} (x) $. Ceux-ci sont dérivés de $ A _ {\ mu} (x) $ en utilisant la définition donnée dans ce wiki (regardez les éléments de la matrice de $ F _ {\ mu \ nu} (x) $).
Il savère que la transformation $ A _ {\ mu} (x) \ rightarrow A _ {\ mu} (x) + \ partial _ {\ mu} f (x) $ pour toute fonction deux fois différentiable $ f (x) $ donne les mêmes valeurs des champs observables $ \ vec {E} (x) $ et $ \ vec {B } (x) $. Il y a donc une relation déquivalence
$ A _ {\ mu} (x) \ approx A _ {\ mu} (x) + \ partial _ {\ mu} f (x) $ .
Et en général, les théories de jauge sont des théories où les quantités observables sont des fonctions sur les classes déquivalence de certains vecteurs dans un espace vectoriel. dans ce cas, nos vecteurs étaient $ A _ {\ mu} (x) $ (ce sont des vecteurs dans lespace des fonctions de deux fonctions différentiables sur lespace-temps), et notre relation déquivalence a été donnée ci-dessus.
Quant à votre finale la question de savoir si des choses comme lénergie totale du système étant déterminée uniquement jusquà un facteur constant dans nimporte quel cadre de référence fait de la dynamique newtonienne une théorie de jauge. La réponse est non, pas vraiment. Fondamentalement, si vous ne parlez pas dune théorie des champs, un physicien nappellera pas la chose une théorie de jauge.
Commentaires
- Bonne réponse, mais il serait peut-être plus précis de dire que les observables dans une théorie de jauge sont des fonctions sur un ensemble de classes déquivalence de [choses comme les connexions et les sections de bundle] équivalence de jauge mod.La frustration de la théorie de la jauge est que nous pouvons ‘ ne pas connaître de nombreux cas où nous pouvons décrire ces fonctions sauf en donnant des fonctions sur les connexions et les sections.
- Vous avez raison, mon langage est un peu bâclé. Il devrait lire quelque chose comme » les observables sont des fonctions sur les classes déquivalence de certains espaces vectoriels. »
Réponse
Linvariance de jauge est simplement une redondance dans la description dun système physique. Cest à dire. nous pouvons choisir parmi un nombre infini de potentiels vectoriels dans E & M.
Par exemple, un nombre infini de potentiels vectoriels peut décrire lélectromagnétisme par la transformation ci-dessous
$$ A (x) \ to A_ \ mu (x) + \ partial_ \ mu \ alpha (x) $$
Le choix dune jauge spécifique (fixation de jauge) peut rendre la résolution un problème physique beaucoup plus facile quil ne le serait si vous ne corrigiez pas de jauge.
Normalement, on choisit la jauge de Coulomb: $ \ nabla \ cdot A = 0 $.
Cela devrait il faut souligner que linvariance de jauge nest PAS une symétrie de la nature et que vous ne pouvez rien mesurer qui lui est associé.
Linvariance de jauge est très utile dans la théorie quantique des champs et est cruciale pour prouver la renormalisabilité. De plus, les éléments de la matrice S dans QFT nécessitent un lagrangien local et donc une invariance de jauge.
Pour illustrer pourquoi nous introduirions le vecteur potentiel $ A ^ \ mu $, considérons leffet Aharonov-Bohm qui se produit en raison de propriétés topologiques globales du potentiel vectoriel. Il y a encore dautres raisons pour lesquelles linvariance de jauge rend la vie facile, réduisant les degrés de liberté du photon dans la soi-disant covariante ou la jauge $ R_ \ xi $, la causalité, etc. travailler à travers la théorie quantique des champs. : D
Commentaires
- @ user122066 Pour référence future, si vous avez besoin de rechercher un symbole, voir cette question tex.SE . Mais seules certaines commandes (La) TeX sont prises en charge dans MathJax. Consultez la documentation MathJax pour une liste.
- Pour toutes les références MathJax, vérifiez ceci: Tutoriel de base MathJax et référence rapide
- @ user122066: vous avez écrit: » Maintenant, cest une propriété absolument cruciale de la physique moderne et nous pourrions très bien être perdus sans cela! » Je pense que vous exagérez ici et cest ce qui fait une telle phrase » effrayant « . Il ny a aucune preuve que nous devons travailler uniquement avec les » théories de jauge « . Dautres approches sont tout simplement inexplorées.
- @VladimirKalitvianski assez juste. Il existe des relations de récursion liées à la matrice S qui évitent les jauges mais il est ‘ très difficile dimaginer quelque chose en cours de découverte qui rend la conputation plus facile que linvariance de jauge. Vous avez tout à fait raison cependant. Je supprimerai cette partie
- (également utile pour la recherche de symboles TeX – Detexify .)
Réponse
Ces calculs ne dépendent très souvent que de la différence entre deux valeurs, pas des valeurs concrètes elles-mêmes . Vous êtes donc libre de choisir un zéro à votre convenance. Sagit-il dun exemple dinvariance de jauge dans le même sens que les exemples avancés ci-dessus?
Oui en effet, dans la définition la plus générale de linvariance de jauge, cest ce que les physiciens appellent une invariance de jauge globale . Plus dinformations ci-dessous.
Si je devais écrire une réponse en une phrase à votre titre, ce serait ceci:
Linvariance de jauge est la définition bien définie de la loi physique sous une carte de quotents qui condense une configuration / un espace de paramètres / des coordonnées pour un système physique en un ensemble de classes déquivalence de configurations physiquement équivalentes.
Cest dans le même sens que, par exemple, le produit coset est bien défini sous la carte qui quotient le sous-groupe normal dun groupe. La physique dune configuration est indépendante du choix du membre de la classe déquivalence .
Dans ses termes les plus simples, linvariance de jauge est simplement une affirmation quil y a redondance dans une description mathématique dun système physique. Autrement dit, le système a une symétrie , une invariance par rapport à un groupe de transformations.
Une symétrie de jauge globale est celle où lespace de configuration est un produit cartésien simple ( ie un faisceau de fibres trivial) de lensemble des classes déquivalence physiquement distinctes et un paramètre redondant, comme avec votre exemple de différence entre deux valeurs. Si la description physique est une description lagrangienne, alors cest là que le théorème de Noether vient au premier plan et identifie les quantités conservées, une pour chaque paramètre redondant.Le groupe de jauge, cest-à-dire groupe de symétries, affecte toutes les classes déquivalence (fibres) de la même manière. La soustraction dun potentiel constant à un potentiel électrostatique est une telle symétrie, et une énorme avancée pour Corvid Civilization, car elle permet aux corbeaux de sasseoir sur des lignes électriques à haute tension et de tirer joyeusement la brise ensemble, discutant de leurs dernières réflexions sur les théories de jauge et déclarant que » Plus jamais! » faut-il craindre que lajout global de 22kV au potentiel électrostatique puisse changer la physique du système auquel nous appartenons.
Cependant, généralement lorsque les physiciens parlent dune théorie de jauge, ils en parlent dans laquelle le groupe de symétrie peut agir dune manière plus générale, avec un membre du groupe différent agissant à chaque point de lespace de configuration. Le faisceau de fibres correspondant nest plus trivial. Bien que vous vouliez un exemple plus simple que lélectrodynamique, je ne pense pas quil y en ait un. La phase ajoutée à la fonction donde électronique peut être nimporte quelle fonction lisse des coordonnées, et les termes supplémentaires qui découlent de la règle de Leibniz appliquée aux dérivées de les équations de mouvement de la fonction donde (Dirac, Schrödinger) sont exactement absorbées dans la partie fermée de la forme unique du potentiel EM. Soit dit en passant, jaime toujours visualiser le potentiel EM dans lespace de Fourier, ce que nous pouvons faire avec des restrictions raisonnables ( par exemple un postulat selon lequel nous ne penserons quà des distributions tempérées, par exemple) , car la partie spatiale de la partie redondante des quatre potentiels est alors sa composante le long du vecteur donde ( ie considérée comme un vecteur à 3), et seule la composante normale au vecteur donde compte physiquement: cest la seule partie qui survit $ A \ mapsto \ mathrm {d} A = F $.
Il y a deux choses que je pense que vous devriez prendre dans lexemple EM:
-
Même si cela conduit pratiquement à un peu plus de complexité, conceptuellement, ce nest quun petit saut par rapport à votre simple exemple symétrique de jauge globale; nous permettons simplement aux symétries dagir localement au lieu dagir sur tous les points de lespace de configuration également;
-
Prenant lexemple de lélectromagnétisme expérimentalement réel , nous postulons que cette invariance de jauge m Il peut être pertinent de manière plus générale, cest pourquoi nous regardons sa présence dans dautres phénomènes physiques. Ce nest rien de plus quun acte motivé par une intuition. Expérimentalement , nous trouvons que cest une chose fructueuse à faire. En physique, il ny a pas de perspective plus profonde que les résultats expérimentaux.
Enfin, je dois mentionner que les notions de jauge / faisceau de fibres sont également utiles lorsque nous déclarons artificiellement des classes déquivalence de configurations fondées sur les besoins de notre problème , même sil existe une différence physique entre les membres de la classe déquivalence. Lun des plus beaux exemples de cette façon de penser est Montgomery « s » Théorie de la jauge du chat tombant « . Nous étudions les classes déquivalence de configuration de chat qui sont modulo équivalentes isométrie euclidienne appropriée pour formuler un espace en forme de chat , qui, dans le traitement standard où le chat est considéré comme un robot à deux sections avec une rotule sans torsion, se révèle être le plan projectif réel $ \ mathbb {RP} ^ 2 $. Lensemble de lespace de configuration est alors un faisceau de fibres avec lespace de forme $ \ mathbb {RP} ^ 2 $ comme base et le groupe $ SO (3) $ définissant les orientations comme fibre Le chat peut basculer tout en conservant le moment angulaire en utilisant des déformations cycliques de sa propre forme en raison de la courbure de la connexion qui découle de la notion de transport parallèle quimplique la conservation du moment angulaire.
Réponse
Voici lexemple le plus élémentaire de symétrie de jauge auquel je puisse penser.
Supposons que vous vouliez t o Discutez de quelques fourmis qui se promènent sur un groupe Möbius. Pour décrire les positions des fourmis, il est pratique dimaginer couper la bande sur sa largeur, pour quelle devienne un rectangle. Ensuite, vous pouvez me dire où se trouve une fourmi en me disant trois choses:
- Sa latitude – sa position le long de la largeur du rectangle.
- Sa longitude – sa position sur la longueur du rectangle.
- Son orientation : quelle saccroche à la surface supérieure ou inférieure du rectangle.
La signification de la longitude dépend de lemplacement de cette coupe imaginaire. Si vous déplacez la coupe, toutes les « longitudes des fourmis » changent. Il ne peut y avoir aucune raison physique de préférer une coupe à une autre, car vous pouvez faire glisser la bande sur sa longueur sans changer sa forme ni affecter le comportement des fourmis. mots, il ne peut pas y avoir de notion physiquement significative de longitude absolue, car la bande a une symétrie de translation .
De même, la signification de l’orientation dépend de la façon dont vous étiquetez les surfaces du rectangle en haut et en bas.Il ne peut y avoir aucune raison physique de préférer un étiquetage à un autre, car vous pouvez échanger les deux surfaces de la bande sans changer sa forme ni affecter le comportement des fourmis. Cet échange est un exemple de symétrie de jauge . Il a des caractéristiques frappantes qui ne sont pas partagées par les symétries ordinaires. Jetons un coup d’œil à l’une d’entre elles.
Pour chaque symétrie d’une situation, il y a un aspect de la situation cela peut être décrit de plusieurs manières, sans aucune raison physique de choisir entre eux. Parfois, cependant, il est utile de faire un choix et de sy tenir, même si le choix na pas de sens physiquement. Dans les discussions sur les personnes naviguant à la surface de la Terre, par exemple, à peu près tout le monde que je connais définit la longitude en utilisant une coupe qui passe par Greenwich, Londres, principalement parce que certaines personnes qui vivait là-bas a conquis le monde et imprimé de nombreuses cartes marines.
Si nous étions allés observer les fourmis sur une bande cylindrique ordinaire, nous aurions pu nous fixer sur une notion dorientation tout aussi facilement. On « peindrait un côté du groupe turquoise pour » haut « et lautre côté bleu pour » bas « , et ce serait ça. Sur un groupe Möbius, les choses sont plus compliquées, car un groupe Möbius na quun côté! vous essayez de peindre une surface turquoise et la surface opposée bleue, en commençant dans une petite région de la bande et en vous déplaçant vers lextérieur, les zones turquoise et bleu entreront inévitablement en collision (dans notre discussion précédente, la collision était cachée le long de la coupe de longitude).
Dans une situation avec une symétrie ordinaire, comme une symétrie de traduction, vous ne pouvez pas choisir entre les descriptions possibles dune manière qui est physiquement significative. Dans une situation avec une symétrie de jauge, vous ne pouvez même pas être capable de choisir entre les descriptions possibles dune manière qui est globalement cohérente! Cependant, vous pouvez toujours choisir des descriptions cohérentes dans de petites régions de lespace. Cest pourquoi les symétries de jauge sont souvent appelées symétries locales .
Après avoir tenté une description longue et élémentaire de ce quest une symétrie de jauge, jaimerais également proposer une courte et sophistiquée. Dans nos modèles physiques les plus simples, les événements ont lieu sur une variété lisse appelée espace ou espace-temps . Une symétrie ordinaire est un difféomorphisme de lespace-temps qui préserve la possibilité physique dévénements. Dans les modèles plus sophistiqués, les événements se déroulent sur un faisceau de fibres dans lespace-temps. Une symétrie de jauge est un automorphisme du faisceau de fibres qui préserve la possibilité physique dévénements.
Dans notre exemple élémentaire, le groupe de Möbius joue le rôle despace, et les fourmis se promènent dans le groupe. faisceau dorientation. Le faisceau dorientation a un automorphisme qui échange les deux surfaces de la bande.
Dans lélectromagnétisme classique, lespace-temps de Minkowski ou une autre variété lorentzienne joue le rôle despace-temps, et le champ électromagnétique est représenté par un connexion sur un faisceau de cercles dans lespace-temps. Dans la image de Kaluza-Klein , les particules chargées se déplacent dans le faisceau de cercles, volant en lignes droites dont les « ombres » dans lespace-temps sont les chemins en spirale que nous voyons. Le faisceau de cercles a une famille dautomorphismes qui font tourner les fibres du cercle, que les gens imaginaires appellent une symétrie de jauge $ \ operatorname {U} (1) $. Cette image généralise à toutes les théories classiques de Yang-Mills.
Dans la image Palatini de la relativité générale, une variété de 4 $ -dimensionnelle lisse joue le rôle despace-temps et le champ gravitationnel est représenté par un $ \ operatorname {SO} (3,1) $ connexion sur le faisceau de cadres du manifold. Je soupçonne que les symétries de jauge de la gravité linéarisée que vous avez mentionnées sont des automorphismes du faisceau de cadres.
Dans limage de la relativité générale dEinstein, les symétries sont des difféomorphismes de lespace-temps. Je les classe plutôt comme des symétries ordinaires. que les symétries de jauge. Comme tparker la mentionné , cependant, tout le monde nutilise pas le terme « symétrie de jauge » de la même manière.
Commentaires
- Merveilleux! Lidée du groupe M ö bius est tout simplement magnifique, et elle capture vraiment toute lessence didées beaucoup plus compliquées. Jaime aussi la façon dont le flux didées montre comment le simple se généralise de manière transparente.
- Hé, quest-ce que ‘ s avec les trois votes? Vous ne savez pas quoi ‘ est mal avec les lurkers sur ce site, cest la meilleure réponse à cette question jusquà présent, étant donné les exigences de lOP ‘. Quoi quil en soit, lun des votes est le mien.
- @WetS avannaAnimalakaRodVance, je ne ‘ pas minquiéter du nombre de votes. Si vous rencontrez quelquun qui pourrait bénéficier de cette réponse, vous pouvez simplement le lier directement.À titre de référence, cela fonctionne aussi bien en bas de la liste de réponses triées par vote quen haut.
Answer
Il y a une interprétation physique très intéressante de linvariance de jauge dans le cas de la symétrie $ U (1) $. La symétrie de jauge est le seul moyen dobtenir une interaction invariante de Lorentz de la matière (au sens large – le champ de spin arbitraire) et des photons (étant des particules sans masse dhélicité 1), qui diminue comme $ \ frac {1} {r ^ { 2}} $ à de grandes distances (cette déclaration nest rien dautre que la loi de Coulomb). En bref, $ A _ {\ mu} $ à 4 potentiels, qui fournit la loi carrée inversée des interactions EM, nest pas la covariante de Lorentz, et la manifestation de linvariance de Lorentz de linteraction conduit à une conservation locale de charge.
Vraiment, on peut montrer à partir de considérations très générales, basées sur la symétrie de notre espace-temps, que les photons sont présentés par le 4-tenseur antisymétrique $ F _ {\ mu \ nu} $, appelé Tenseur de force EM . Cest la covariante de Lorentz formellement (en utilisant des manipulations naïves avec des indices tenseur) et par construction (comme le champ qui représente les particules dhélicité 1), cest-à-dire sous Transformation de Lorentz donnée par la matrice $ \ Lambda _ {\ mu} ^ {\ \ nu} $ elle est transformée en $$ F _ {\ mu \ nu} \ en \ Lambda _ {\ mu} ^ {\ \ alpha} \ Lambda _ {\ nu} ^ {\ \ beta} F _ {\ alpha \ beta} $$ Ensuite, supposons que nous ayons des champs de matière $ \ psi $ et discutons dune interaction de la matière avec des photons. La manière la plus évidente dobtenir une telle interaction est de lobtenir en construire toutes les circonvolutions possibles de $ F _ {\ mu \ nu} $ avec des champs de matière et des objets covariants de Lorent (matrices de Dirac, connexion Levi-Civita etc.). Supposons également que nous sachions par expérience que linteraction se résume à $ \ frac {1} {r ^ {2}} $ à grande distance. Malheureusement, cela est impossible si nous utilisons $ F _ {\ mu \ nu} $. La raison formelle est que le propagateur de ce champ, qui montre la loi dinteraction, tombe plus vite que $ \ frac {1} {r ^ {2}} $. Ceci est dû au fait que deux indices et antisymétrie de $ F _ {\ mu \ nu} $.
Nous pouvons faire un indice et introduire lobjet $ A _ {\ mu} $ avec un indice, appelé 4-potential : $$ F _ {\ mu \ nu} = \ partial _ {\ mu} A _ {\ nu} – \ partial _ {\ nu} A _ {\ mu} $$ Les interactions sont maintenant construites par des convolutions de $ A_ { \ mu} $ avec des champs de matière et dautres objets covariants.
Bien sûr, nous exigeons que $ A _ {\ mu} $ représente les particules dhélicité sans masse 1 ainsi que $ F _ {\ mu \ nu} $. Malheureusement, cette exigence conduit à affirmer que le 4-potentiel nest pas « t la covariante de Lorentz (bien que formellement, bien sûr). Précisément, sous Lorentz le champ de transformation $ A _ {\ mu} $, qui est supposé représenter des particules sans masse dhélicité 1, est remplacé par $$ \ tag 1 A _ {\ mu} \ en \ Lambda _ {\ mu} ^ {\ \ nu} A _ {\ nu} + \ partial _ {\ mu} \ varphi $$ On voit que ce nest pas la covariante de Lorentz. Le lagrangien libre pour $ A _ {\ mu} $, qui est juste $$ L = – \ frac { 1} {4} F _ {\ mu \ nu} F ^ {\ mu \ nu}, $$ est linvariant de Lorentz.
Mais il y a une façon de préserver linvariance de Lorentz des interactions. les construire de manière à être invariante sous la transformation $ A _ {\ mu} \ en A _ {\ mu} + \ partial _ {\ mu} \ varphi $. Précisément, lamplitude de linteraction $ M _ {\ mu_ {1} … \ mu_ {n}} (p_ {i}, \ epsilon_ {j} (k_ {j})) $, où $ \ epsilon $ sont des vecteurs dhélicité photonique (polarisation), $ p_ {i} $ sont tous des moments dinteraction particules et $ k_ {j} $ étant des moments de photons), doit b e invariant sous transformation $$ \ tag 2 \ epsilon _ {\ mu} (p) \ to \ epsilon _ {\ mu} (p) + \ alpha p _ {\ mu} $$ Sur le langage formel, comme cela peut être montré par traitant des processus avec émission de photons mous (photons à impulsion presque nulle), cela signifie quil doit y avoir une loi de conservation des couplages de matière $ g_ {i} $: $$ g_ {1} + g_ {2} + … = \ text {const} $$ Ce nest rien dautre que la loi de conservation des charges. Avec $ (2) $, ce nest rien dautre que la symétrie de jauge $ U (1) $.
Ainsi, nous voyons que linvariance de Lorentz des interactions des photons avec la matière par loi carrée inversée conduit à linvariance de jauge. On peut argumenter de manière analogique le principe déquivalence pour le cas de linteraction des gravitons avec tous les champs.
Réponse
Les théories de jauge décrivent la connectivité de un espace avec de petites dimensions supplémentaires symétriques
Commencez par un cylindre infini (le produit direct dune ligne et dun petit cercle). Le cylindre peut être tordu. Pour éviter de faire appel à des concepts que jessaie dexpliquer, je dirai simplement que le cylindre est fait de treillis métallique: des cercles régulièrement espacés soudés à des fils le long de celui-ci. Les longs fils peuvent tourner comme une unité, introduisant une torsion angulaire entre chaque paire de cercles adjacents. Il est clair quune telle configuration peut être continuellement déformée en une autre: tous ces cylindres sont équivalents du point de vue de la fourmi proverbiale qui rampe dessus.
Remplacez la ligne par une boucle fermée, de sorte que le produit soit un tore (et pensez au tore comme un anneau de maillage, même si faire varier le plan des petits cercles comme cela rompt techniquement lanalogie). Nimporte quelle partie du beignet à court de la chose entière peut être déformée dans la même portion de nimporte quel autre beignet, mais les beignets dans leur ensemble ne peuvent parfois pas être, parce que la torsion du filet autour du beignet ne peut pas être modifiée. Les classes de beignets équivalents sont complètement caractérisées par cette torsion nette, qui est intrinsèquement non locale.
Remplacez la boucle (pas le petit cercle) par une variété de deux dimensions ou plus. Il est vrai, mais pas évident, que la partie physique de la connexion est entièrement donnée par la torsion intégrée autour de toutes les boucles fermées ( boucles Wilson ).
$ A $ et $ F $ quantifient la connectivité
Dans le cas discret, la connexion peut être décrite plus simplement en donnant la torsion entre des cercles adjacents. Dans la limite du continuum, cela devient un « twist gradient » à chaque cercle. Il sagit de $ A_ \ mu $, ce que lon appelle le potentiel vectoriel.
Toute déformation continue peut être décrite par un champ scalaire $ \ phi $ représentant le montant que chaque cercle est tordu (par rapport à lendroit où il était auparavant). Cela modifie $ A_ \ mu $ par le gradient de $ \ phi $, mais ne change aucune quantité physique (intégrale de boucle).
La description dans termes des boucles de Wilson, $ \ oint_ \ gamma A \ cdot \, \ mathrm dx $, est plus élégant car il ne comprend que des quantités physiquement significatives, mais il est non local et hautement redondant. Si l’espace est simplement connecté, vous pouvez éviter le r edundancy et nonlocality en spécifiant la torsion uniquement autour des boucles différentielles, car des boucles plus grandes peuvent être construites à partir delles. Le soi-disant tenseur de champ, $ \ partial_ \ nu A_ \ mu – \ partial_ \ mu A_ \ nu = F _ {\ mu \ nu} $, vous donne exactement cela.
(Si lespace est pas simplement connecté, vous pouvez toujours vous en tirer avec les boucles différentielles plus une torsion nette pour chaque élément dun groupe électrogène du groupe fondamental . Le tore était bien sûr un exemple simple de ceci.)
La force vient de leffet Aharonov – Bohm
Considérons un champ scalaire défini sur tout lespace (contrairement aux champs précédents, celui-ci prend une valeur à chaque point de chaque cercle). Le champ est nul partout sauf pour deux faisceaux étroits qui divergent dun point et se reconvergent ailleurs. (Peut-être quils « sont réfléchis par des miroirs; peut-être que lespace est courbé positivement; cela na pas dimportance.)
À moins que le champ ne soit constant sur les cercles, le comportement dinterférence des faisceaux dépendra de la différence dans la torsion le long des deux chemins. Cette différence nest que lintégrale autour de la boucle fermée formée par les chemins.
Cest leffet (généralisé) Aharonov – Bohm. Si vous le limitez à des chemins différentiellement différents et utilisez $ F _ {\ mu \ nu} $ pour calculer leffet sur linterférence, vous obtenez la loi de la force électromagnétique.
Vous pouvez décomposer le champ en composantes de Fourier. Le spectre de Fourier est discret dans la petite dimension. Lharmonique zéro (constante) nest pas affectée par la torsion. La deuxième harmonique est affectée deux fois plus que la première. Ce sont les charges électriques.
En réalité, pour des raisons inconnues, seules certaines harmoniques extra-dimensionnelles semblent exister. Si seulement le premier harmonique existe, il ya une description équivalente du champ comme une seule amplitude complexe + phase à chaque point des grandes dimensions. La phase est relative à un point zéro local arbitraire qui est également utilisé par le potentiel vectoriel. Lorsque vous comparez la phase à la phase à un point proche, et quil existe une torsion de potentiel vectoriel de $ \ mathrm d \ theta $ entre eux, vous devez ajuster la valeur du champ de $ i \, \ mathrm d \ theta $ . Cest lorigine de la dérivée covariante de jauge .
Les cercles se généralisent à dautres formes
Si vous remplacez le cercles avec 2 sphères, vous obtenez une théorie de jauge $ \ mathrm {SU} (2) $. Cest plus méchant numériquement: le groupe de symétrie nest pas commutatif, vous devez donc introduire la machinerie de lalgèbre de Lie. Géométriquement, cependant, rien beaucoup de choses ont changé. La connectivité est toujours décrite par une torsion nette autour des boucles.
Une différence malheureuse est que la description de la charge comme harmoni extra-dimensionnel cs ne fonctionne plus tout à fait. Les harmoniques sphériques vous donnent uniquement les représentations de spin entier, et toutes les particules connues sont dans les représentations spin-0 ou spin-½ du modèle standard $ \ mathrm {SU} (2) $, donc les particules qui sont affectées par le $ \ mathrm {SU} (2) $ force ne peut pas du tout être décrit de cette façon. Il peut y avoir un moyen de contourner ce problème avec un type de champ plus exotique.
Je nai rien de perspicace à dire sur la partie $ \ mathrm {SU} (3) $ du groupe de jauges du modèle standard, sauf pour souligner que tout le groupe de jauges SM peut être intégré dans $ \ mathrm {Spin} (10) $ , et je pense quil est plus facile de visualiser une 9 sphères quune forme avec $ \ mathrm {SU} (3) $ symétrie.
La relativité générale est similaire
En relativité générale, le tenseur de courbure de Riemann est analogue au tenseur de champ; il représente la rotation angulaire dun vecteur transporté autour dune boucle différentielle. Leffet Aharonov-Bohm est analogue au déficit angulaire autour dune chaîne cosmique . Théorie de Kaluza-Klein faisait à lorigine référence à une manière spécifique dobtenir lélectromagnétisme de la relativité générale en cinq dimensions; maintenant, il fait souvent référence à lidée générale que les forces de jauge du modèle standard et la relativité générale sont probablement des aspects différents de la même chose.
Réponse
En Electrodynamique Classique (CED) linvariance de jauge signifie lindépendance des champs électrique et magnétique dun « choix » particulier des potentiels $ \ varphi $ et $ \ bf {A} $. Léquation des potentiels dépend, bien sûr, du choix particulier de la « jauge », et ils donnent des solutions différentes pour différentes jauges.
Dans QM et QED linvariance de jauge signifie aussi « invariance » de la forme déquations (les solutions étant encore différentes, mais physiquement équivalentes).
Mais il faut rester Noubliez pas que tout changement de variable utile est également acceptable si les résultats correspondants restent physiquement les mêmes. Pour cela, la forme des équations ne doit pas du tout être obligatoire « invariante ».