Ik ben een wiskundestudent met een hobby-interesse in natuurkunde. Dit betekent dat ik graduate cursussen in kwantumdynamica en algemene relativiteitstheorie heb gevolgd zonder het grootste deel van de niet-gegradueerde natuurkundecursussen en de enorme hoeveelheid onderwijs in de fysieke tools en mentaliteit die de andere studenten die de cursus volgden, zoals de stelling van Noether, Lagrangian hadden. en Hamiltoniaanse mechanica, statistische methoden, enzovoort.
De cursussen zelf gingen goed genoeg. Mijn wiskundige ervaring compenseerde min of meer een gebrek aan fysiek begrip. Ik heb echter nog steeds geen elementaire verklaring van ijkinvariantie gevonden (als er zoiets bestaat). Ik ken enkele voorbeelden, zoals hoe het magnetische potentieel uniek is tot een (tijd -) constante gradiënt. Ik kwam het ook tegen in gelineariseerde algemene relativiteitstheorie, waar er verschillende verstoringen zijn in de ruimtetijdmetriek die dezelfde waarneembare dynamiek geven.
Om echt te begrijpen wat er aan de hand is, Ik hou van eenvoudigere voorbeelden. Helaas heb ik er geen kunnen vinden. Ik denk dat, aangezien ‘gauge invariantie’ zon beangstigende uitdrukking is, niemand dat woord gebruikt bij het schrijven naar een middelbare scholier.
Dus, mijn ( heel simpele) vraag is: in veel natuurkundeberekeningen op de middelbare school meet of bereken je tijd, afstand, potentiële energie, temperatuur en andere grootheden. Deze berekeningen zijn vaak alleen afhankelijk van het verschil tussen twee waarden, niet de concrete waarden zelf. U bent dus vrij om een nul naar wens te kiezen. Is dit een voorbeeld van ijkinvariantie in dezelfde zin als de bovenstaande voorbeelden van afgestudeerden? Of zijn dit twee verschillende concepten?
Opmerkingen
- Als je deze vraag leuk vindt, kun je ook genieten van het lezen van dit Phys.SE-bericht.
- John Baez schrijft : ” Het meterprincipe zegt, in eenvoudige bewoordingen, dat je alleen kunt zien als twee deeltjes in dezelfde staat zijn if je verplaatst ze naast elkaar zodat je ze kunt vergelijken. Het uitwerken van de wiskundige consequenties van dit principe leidt tot ijktheorieën die de krachten verklaren die we in de natuur zien. ”
Antwoord
De reden dat het “zo moeilijk te begrijpen is wat natuurkundigen bedoelen als ze het hebben over” ijkvrijheid “, is dat er ten minste vier ongelijke definities zijn die ik heb gebruikt :
-
Definitie 1: Een wiskundige theorie heeft een ijkvrijheid als sommige van de wiskundige vrijheidsgraden “overtollig” zijn in de zin dat twee verschillende wiskundige uitdrukkingen exact hetzelfde fysieke systeem beschrijven . Dan zijn de overtollige (of ‘ijkafhankelijke’) vrijheidsgraden ‘onfysisch’ in de zin dat geen enkel mogelijk experiment hun waarden op unieke wijze zou kunnen bepalen, zelfs niet in principe. Een beroemd voorbeeld is de algehele fase van een kwantumtoestand – deze is volkomen onmeetbaar en twee vectoren in de Hilbertruimte die alleen verschillen in een algemene fase beschrijven exact dezelfde toestand. Een ander voorbeeld, zoals je al zei, is elk soort potentieel dat moet gedifferentieerd zijn om een fysieke grootheid op te leveren – bijvoorbeeld een potentiële energiefunctie. (hoewel sommige van uw andere voorbeelden, zoals temperatuur, geen voorbeelden zijn van ijkafhankelijke grootheden, omdat er een goed gedefinieerd fysiek gevoel van nultemperatuur is.)
Voor fysische systemen die worden beschreven door wiskundige constructies met een ijkvrijheid, is de beste manier om een specifieke fysische configuratie wiskundig te definiëren een equivalentieklasse van ijkafhankelijke functies die alleen verschillen in hun ijkvrijheidsgraden In de kwantummechanica wordt een fysieke toestand bijvoorbeeld niet echt beschreven door een enkele vector in de Hilbertruimte, maar door een equivalentieklasse van vectoren die verschillen door een algemene scalaire mul. tiple. Of eenvoudiger, door een lijn vectoren in Hilbertruimte. (Als je fantasie wilt hebben, wordt de ruimte van fysieke toestanden een projectieve Hilbertruimte genoemd, wat de reeks lijnen is in de Hilbertruimte, of meer precies een versie van de Hilbertruimte waarin vectoren worden geïdentificeerd als ze proportioneel zijn. ik veronderstel dat je fysieke potentiële energieën ook zou kunnen definiëren als sets van potentiële energiefuncties die alleen verschillen door een additieve constante, hoewel dat in de praktijk een soort overkill is. Deze equivalentieklassen verwijderen de ijkvrijheid door constructie, en dat geldt ook voor “ijk-invariant”.
Soms (maar niet altijd) is er een eenvoudige wiskundige bewerking die alle overtollige vrijheidsgraden verwijdert, terwijl alle fysieke graden behouden blijven. Gegeven een potentiële energie kan men bijvoorbeeld de gradiënt nemen om een krachtveld op te leveren, dat direct meetbaar is.En in het geval van klassieke E & M zijn er bepaalde lineaire combinaties van partiële afgeleiden die de potentialen reduceren tot direct meetbare $ {\ bf E} $ en $ {\ bf B} $ velden zonder enige fysieke informatie te verliezen. In het geval van een vector in een Hilbert-kwantumruimte is er echter geen eenvoudige afgeleide bewerking die de fasevrijheid verwijdert zonder iets anders te verliezen.
-
Definitie 2: hetzelfde als definitie 1, maar met de aanvullende vereiste dat de overtollige vrijheidsgraden lokaal zijn. Dit betekent dat er een soort wiskundige bewerking bestaat die afhankelijk is van een willekeurige vloeiende functie $ \ lambda (x) $ op ruimtetijd die de fysieke vrijheidsgraden (dwz de fysiek meetbare grootheden) onveranderlijk laat. Het canonieke voorbeeld is natuurlijk dat als je een smooth-functie neemt $ \ lambda ( x) $, en door $ \ partiële_ \ mu \ lambda (x) $ toe te voegen aan de elektromagnetische vierpotentiaal $ A_ \ mu (x) $ blijven de fysieke grootheden over (de $ {\ bf E} $ en $ {\ bf B } $ velden) ongewijzigd. (In de veldtheorie wordt de vereiste dat de “fysieke vrijheidsgraden” ongewijzigd blijven, zo geformuleerd dat de Lagrangiaanse dichtheid $ \ mathcal {L} [\ varphi (x)] $ ongewijzigd moet blijven , maar andere formuleringen zijn mogelijk.) Deze definitie is duidelijk veel strikter – de voorbeelden die hierboven in Definitie 1 worden gegeven tellen niet mee onder deze definitie – en meestal van de tijd dat natuurkundigen het hebben over ‘ijkvrijheid’ dit is de definitie die ze bedoelen. In dit geval heb je in plaats van slechts een paar overtollige / niet-fysieke vrijheidsgraden (zoals de algemene constante voor je potentiële energie) een continu oneindig aantal. (Om de zaken nog verwarrender te maken, gebruiken sommige mensen de uitdrukking globale ijksymmetrie in de zin van definitie 1 om zaken te beschrijven als de globale fasevrijheid van een kwantumtoestand, wat duidelijk een tegenstrijdigheid zou zijn in termen in de zin van definitie 2.)
Het blijkt dat je, om hiermee om te gaan in de kwantumveldentheorie, je benadering van kwantisering aanzienlijk moet veranderen (technisch gezien moet je “meten, fixeer je padintegraal”) om om alle onfysische vrijheidsgraden te elimineren. Wanneer mensen het hebben over ‘ijkinvariante’ grootheden onder deze definitie, bedoelen ze in de praktijk meestal de direct fysiek meetbare afgeleiden, zoals de elektromagnetische tensor $ F _ {\ mu \ nu} $, die ongewijzigd (‘invariant’) blijven bij elke ijktransformatie . Maar technisch gezien zijn er ook andere ijk-invariante grootheden, b.v. een uniforme kwantumsuperpositie van $ A_ \ mu (x) + \ gedeeltelijke_ \ mu \ lambda (x) $ over alle mogelijke $ \ lambda (x) $ voor een bepaalde $ A_ \ mu (x). $
Zie Terry Tao “s blogpost voor een geweldige uitleg van dit tweede gevoel van ijksymmetrie vanuit een meer wiskundig perspectief.
-
Definitie 3: Van een Lagrangiaan wordt soms gezegd dat hij een “ijksymmetrie” bezit als er een bewerking bestaat die afhangt van een willekeurige continue functie op de ruimtetijd waardoor deze onveranderlijk blijft, zelfs als de vrijheidsgraden worden gewijzigd zijn fysiek meetbaar.
-
Definitie 4: Voor een “roostermaattheorie” gedefinieerd op lokale rooster Hamiltonians, bestaat er een operator ondersteund op elke roosterlocatie die pendelt met de Hamiltoniaan. In sommige gevallen komt deze operator overeen met een fysiek meetbare grootheid.
De gevallen van Definities 3 en 4 zijn een beetje conceptueel subtiel, dus ik ga niet hier in – ik kan ze in een vervolg behandelen -up vraag of iemand geïnteresseerd is.
Update: Ik heb vervolgantwoorden geschreven met betrekking tot de vraag of er enige betekenis is waarin de ijkgraden fysiek meetbaar kunnen zijn in het Hamiltoniaanse geval en de Lagrangiaanse zaak .
Reacties
- Uitstekend antwoord! Dit is een van de beste explanties (op één plek) die ik tot nu toe ben tegengekomen !!!! : D
- Ik heb de vervolgvraag gesteld over de subtiliteiten tussen # 3 en # 4
- physics.stackexchange.com/q/ 267175/122066
- @ user122066 Zie de update aan het einde van mijn antwoord voor links naar mijn follow-ups.
Antwoord
Ik begreep dit pas nadat ik een les had gevolgd in de algemene relativiteitstheorie (GR), differentiaalmeetkunde en kwantumveldentheorie (QFT). De essentie is slechts een verandering van coördinatensystemen die in de afgeleide moet worden weerspiegeld. Ik zal uitleggen wat ik bedoel.
Je hebt een theorie die invariant is onder een of andere symmetriegroep. Dus in de kwantumelektrodynamica heb je een Lagrangiaanse dichtheid voor de fermionen (nog geen fotonen) $$ \ mathcal L = \ bar \ psi (x) [\ mathrm i \ gamma ^ \ mu \ partiële_ \ mu – m] \ psi (x) \,. $$ Deze $ \ bar \ psi $ is slechts $ \ psi ^ \ dagger \ gamma ^ 0 $, belangrijk is dat het complex geconjugeerd is.Het feit dat het een viervector is in spin-ruimte is hier niet van belang. Wat men nu kan doen is $ \ psi \ naar \ exp (\ mathrm i \ alpha) \ psi $ transformeren met wat $ \ alpha \ in \ mathbb R $. Dan $ \ bar \ psi \ to \ bar \ psi \ exp (- \ mathrm i \ alpha) $ en de Lagrangiaan zal invariant zijn aangezien de afgeleide niet werkt op de exponentiële functie, het is slechts een fasefactor. Daar heb je een globale symmetrie.
Promoot nu de symmetrie naar een lokale, waarom niet? In plaats van een globale $ \ alpha $ heeft men nu $ \ alpha (x) $. Dit betekent dat we op elk punt in de ruimtetijd een andere $ \ alpha $ kiezen. Het probleem is dat wanneer we nu transformeren, men de $ \ gedeeltelijke_ \ mu \ alpha (x) $ oppikt met de keten- en productregels van differentiatie. Dat lijkt in eerste instantie een technische complicatie.
Er is een meer veelzeggende manier om dit te zien:
Je neemt een afgeleide van een veld $ \ psi (x) $. Dit betekent dat een verschilquotiënt moet worden genomen zoals $$ \ partiële_ \ mu \ psi (x) = \ lim _ {\ epsilon \ to 0} \ frac {\ psi (x + \ epsilon \ vec e_ \ mu) – \ psi (x) } {\ epsilon} \,. $$ Dit werkt prima met een globale transformatie. Maar met de lokale transformatie trekt u in feite twee waarden af die verschillend worden gemeten . In differentiële geometrie heb je dat de raaklijnen op de verschillende punten van het verdeelstuk verschillend zijn en daarom kan men vectoren niet alleen op hun componenten vergelijken. Men heeft een verbinding nodig met verbindingscoëfficiënten om parallel transport te bieden. Het is hier vergelijkbaar. We hebben nu $ \ phi $ gepromoveerd van leven op $ \ mathbb R ^ 4 $ naar leven in de bundel $ \ mathbb R ^ 4 \ maal S ^ 1 $ omdat we een U (1) ijkgroep hebben. Daarom hebben we een soort verbinding nodig om de getransformeerde $ \ phi $ van $ x + \ epsilon \ vec e_ \ mu $ naar $ x $ te transporteren. Dit is waar men een verbinding moet introduceren, namelijk $$ \ partiële_ \ mu \ naar \ mathrm D_ \ mu: = \ partiële_ \ mu + \ mathrm i A_ \ mu \,. $$
Als je plugt dat in de Lagrange-dichtheid om het $$ \ mathcal L = \ bar \ psi (x) [\ mathrm i \ gamma ^ \ mu \ mathrm D_ \ mu – m] \ psi (x) $$ te maken en kies dan $ A_ \ mu = \ gedeeltelijke_ \ mu \ alpha $ je zult zien dat de Lagrangiaanse dichtheid zelfs onder lokale transformaties onveranderlijk blijft, aangezien de verbindingscoëfficiënt de ongewenste term gewoon aftrekt van de product- / kettingregel.
In de algemene relativiteitstheorie heb je de symmetrie onder willekeurig diffeomorfisme, de prijs is dat je de afgeleide moet veranderen in een verbinding, $$ \ partieel \ naar \ nabla: = \ partieel + \ Gamma + \ cdots \,. $$
Antwoord
Aangezien je zei dat je een wiskundige achtergrond hebt, vind je het misschien leuk om een antwoord te nemen in termen van equivalentieklassen.
Een ijktheorie is een fysische theorie waarbij de waarneembare grootheden, zoals in dingen die je zou kunnen meten met een experiment met perfecte meetapparatuur, equivalentieklassen zijn in een vectorruimte.
Elektromagnitisme is het meest voorkomende voorbeeld. Moderne natuurkundetheorieën worden altijd geschreven als vezelbundels waarbij het onderliggende spruitstuk de ruimtetijd is en de vezels een of andere raakruimte zijn die is geassocieerd met elk punt (een gebeurtenis genoemd) in de ruimtetijd. E & M in vrije ruimte (geen kosten aanwezig) wordt beschreven door een 4-componentobject genaamd $ A _ {\ mu} $ te koppelen aan elk ruimtetijdpunt, $ x $, en $ A _ {\ mu} (x) $ om te voldoen aan de vergelijkingen van maxwell.
De waarneembare, even meetbare grootheden in de natuur zijn echter de elektrische en magnetische velden, $ \ vec {E} (x) $ en $ \ vec {B} (x) $. Deze zijn afgeleid van $ A _ {\ mu} (x) $ met behulp van de definitie in deze wiki (kijk naar de matrixelementen van $ F _ {\ mu \ nu} (x) $).
Het blijkt dat de transformatie $ A _ {\ mu} (x) \ rightarrow A _ {\ mu} (x) + \ partieel _ {\ mu} f (x) $ voor elke tweemaal differentieerbare functie $ f (x) $ geeft dezelfde waarden van de waarneembare velden $ \ vec {E} (x) $ en $ \ vec {B } (x) $. Er is dus een equivalentierelatie
$ A _ {\ mu} (x) \ approx A _ {\ mu} (x) + \ partieel _ {\ mu} f (x) $ .
En in het algemeen zijn ijktheorieën theorieën waarin de waarneembare grootheden functies zijn op equivalentieklassen van sommige vectoren in een vectorruimte. in dit geval waren onze vectoren $ A _ {\ mu} (x) $ (dit zijn vectoren in de functieruimte van tweemaal differentieerbare functies op ruimtetijd), en onze equivalentierelatie werd hierboven gegeven.
Wat betreft uw laatste vraag of zaken als de totale energie van het systeem dat alleen wordt bepaald tot een constante factor in een referentiekader, de Newtoniaanse dynamica een ijktheorie maakt. Het antwoord is nee, niet echt. Kortom, als je het niet over een veldtheorie hebt, zal een natuurkundige het geen ijktheorie noemen.
Opmerkingen
- Mooi antwoord, maar misschien zou het preciezer zijn om te zeggen dat observabelen in een ijktheorie functies zijn op een reeks equivalentieklassen van [zaken als verbindingen en bundeldelen] equivalentie van de mod-meter.De frustratie van de ijktheorie is dat we ‘ niet veel gevallen kunnen kennen waarin we deze functies kunnen beschrijven, behalve door functies te geven op de verbindingen en secties.
- Je hebt gelijk, mijn taalgebruik is een beetje slordig. Het zou iets moeten lezen als ” observabelen zijn functies op de equivalentieklassen van een vectorruimte. ”
Answer
Meter-invariantie is gewoon een redundantie in de beschrijving van een fysiek systeem. D.w.z. we kunnen kiezen uit een oneindig aantal vectorpotentialen in E & M.
Een oneindig aantal vectorpotentialen kan bijvoorbeeld elektromagnetisme beschrijven door de onderstaande transformatie
$$ A (x) \ naar A_ \ mu (x) + \ partieel_ \ mu \ alpha (x) $$
Het kiezen van een specifieke meter (meterbevestiging) kan het oplossen een fysiek probleem veel gemakkelijker dan het zou zijn als je geen meter zou repareren.
Normaal gesproken kiest men de Coulomb-meter: $ \ nabla \ cdot A = 0 $.
Het zou moeten benadrukt dat ijkinvariantie GEEN symmetrie van de natuur is en dat je er niets mee kunt meten.
Gauge-invariantie is het nuttigst in de kwantumveldentheorie en is cruciaal bij het bewijzen van renormaliseerbaarheid. Bovendien vereisen S-matrixelementen in QFT een lokale Lagrangiaan en dus ijkinvariantie.
Als voorbeeld van waarom we het vectorpotetial $ A ^ \ mu $ zouden introduceren, beschouwen we het Aharonov-Bohm-effect dat ontstaat als gevolg van globale topologische eigenschappen van het vectorpotentiaal. Er zijn nog andere redenen waarom ijkinvariantie het leven gemakkelijk maakt, door het verminderen van de vrijheidsgraden van het foton in de zogenaamde covariante of $ R_ \ xi $ ijking, causaliteit, etc. In wezen wordt het nut van ijkinvariantie pas helemaal duidelijk wanneer men begint te proberen om te werken via kwantumveldentheorie. : D
Opmerkingen
- @ user122066 Voor toekomstige referentie, als je een symbool moet opzoeken, zie deze tex.SE-vraag . Maar alleen bepaalde (La) TeX-commandos worden ondersteund in MathJax. Zie de MathJax-documentatie voor een lijst.
- Controleer dit voor alle MathJax-verwijzingen: MathJax basic tutorial en quick reference
- @ user122066: je schreef: ” Nu is het een uiterst cruciale eigenschap van de moderne fysica en we zouden heel goed verloren kunnen gaan zonder dit! ” Ik denk dat je hier overdrijft en dit is wat zon zin ” maakt beangstigend “. Er is geen bewijs dat we alleen moeten werken met ” ijktheorieën “. Andere benaderingen zijn gewoon onontgonnen.
- @VladimirKalitvianski eerlijk genoeg. Er zijn recursierelaties gerelateerd aan de S-matrix die meters vermijdt, maar het ‘ is erg moeilijk voor te stellen dat er iets ontdekt wordt dat conputatie gemakkelijker maakt dan het meten van invariantie. Je hebt echter helemaal gelijk. Ik zal dit deel verwijderen.
- (Ook handig voor het opzoeken van TeX-symbolen – Detexify .)
Answer
Deze berekeningen zijn vaak alleen afhankelijk van het verschil tussen twee waarden, niet van de concrete waarden zelf . Je bent dus vrij om een nul naar wens te kiezen. Is dit een voorbeeld van ijkinvariantie in dezelfde zin als de bovenstaande voorbeelden van afgestudeerden?
Ja inderdaad, in de meest algemene definitie van ijkinvariantie, het is wat natuurkundigen een globale ijkinvariantie noemen. Meer daarover hieronder.
Als ik een antwoord van één zin op je titel zou moeten schrijven, zou het dit zijn:
Gauge-invariantie is de goed gedefinieerde fysische wet onder een quotentkaart die een configuratie / parameterruimte / coördinaten voor een fysiek systeem condenseert in een set van equivalentieklassen van fysiek equivalente configuraties.
Dit is in dezelfde zin dat, bijvoorbeeld, het coset-product goed gedefinieerd is onder de kaart die de normale subgroep van een groep weg quotiënteert. De fysica van een configuratie is onafhankelijk van de keuze van het equivalentieklasse-lid .
In de meest simpele bewoordingen is ijkinvariantie gewoon een bewering dat er redundantie zit in een wiskundige beschrijving van een fysiek systeem. Anders gezegd, het systeem heeft een symmetrie , een invariantie met betrekking tot een groep transformaties.
Een globale ijksymmetrie is er een waarbij de configuratieruimte is een eenvoudig Cartesiaans product ( dwz een triviale vezelbundel) van de set fysiek verschillende equivalentieklassen en een overtollige parameter, zoals bij uw verschil tussen twee waarden. Als de fysieke beschrijving een Lagrangiaanse beschrijving is, dan komt de stelling van Noether hier naar voren en identificeert deze geconserveerde grootheden, één voor elk van deze overtollige parameters.De ijkgroep, d.w.z. groep symmetrieën, beïnvloedt alle equivalentieklassen (vezels) in gelijke mate. Het aftrekken van een constant potentieel van een elektrostatisch potentieel is zon symmetrie en een enorme vooruitgang voor Corvid Civilization, omdat het kraaien op hoogspanningskabels laat zitten en vrolijk samen de wind schiet, hun laatste gedachten over ijktheorieën bespreken en dat verklaart ” Nooit meer! ” zullen we vrezen dat de wereldwijde toevoeging van 22 kV aan het elektrostatische potentieel de fysica van het systeem waartoe we behoren kan veranderen.
Wanneer natuurkundigen het echter gewoonlijk hebben over een ijktheorie, bedoelen ze een theorie waarin de symmetriegroep kan optreden op een meer algemene manier, met een ander groepslid dat op elk punt in de configuratieruimte handelt. De bijbehorende vezelbundel is niet langer triviaal. Hoewel je een eenvoudiger voorbeeld wilde dan elektrodynamica, denk ik niet dat er een is. De fase die aan de elektronengolffunctie wordt toegevoegd, kan elke vloeiende functie van coördinaten zijn, en de extra termen die voortkomen uit de Leibniz-regel die worden toegepast op de afgeleiden in de bewegingsvergelijking van de golffunctie (Dirac, Schrödinger) wordt precies opgezogen in het gesloten deel van de EM-potentiaal-eenvorm. Overigens, terzijde, ik vind het altijd leuk om EM-potentieel in de Fourier-ruimte te visualiseren, wat we kunnen doen met redelijke beperkingen ( bijv. een postulaat dat we bijvoorbeeld alleen aan getemperde distributies gaan denken) , omdat het ruimtelijke deel van het redundante deel van de vierpotentiaal dan de component is langs de golfvector ( ie wordt gezien als een 3-vector), en alleen de component loodrecht op de golfvector is fysiek van belang: het is het enige deel dat $ A \ mapsto \ mathrm {d} A = F $ overleeft.
Er zijn twee dingen die je volgens mij uit het EM-voorbeeld moet nemen:
-
Hoewel het praktisch tot nogal wat verdere complexiteit leidt, is het conceptueel gezien slechts een kleine sprong van uw eenvoudige symmetrische voorbeeld van een globale meter; we laten de symmetrieën gewoon lokaal werken in plaats van in te werken op alle configuratieruimtepunten evenzeer;
-
In navolging van het experimenteel reële elektromagnetisme, veronderstellen we dat deze maatinvariantie m Het zou meer in het algemeen relevant kunnen zijn, en daarom kijken we naar zijn aanwezigheid in andere fysische verschijnselen. Dit is niets meer dan een daad ingegeven door een voorgevoel. Experimenteel vinden we dat dit vruchtbaar is om te doen. In de natuurkunde is er geen dieper inzicht dan experimentele resultaten.
Ten slotte moet ik vermelden dat de begrippen meter / vezelbundel ook nuttig zijn wanneer we kunstmatig equivalentieklassen van configuraties verklaren op basis van de behoeften van ons probleem , zelfs als er een fysiek verschil is tussen leden van de gelijkwaardigheidsklasse. Een van de mooiste voorbeelden van deze manier van denken is Montgomery “s ” Gauge Theory of the Falling Cat “. We bestuderen equivalentieklassen van kattenconfiguraties die modulo equivalent zijn juiste Euclidische isometrie om een katvormruimte te formuleren, die, in de standaardbehandeling waarbij de kat wordt beschouwd als een tweedelige robot met draaivrije kogelgewricht, de echt projectief vlak $ \ mathbb {RP} ^ 2 $. De hele configuratieruimte is dan een vezelbundel met de vormruimte $ \ mathbb {RP} ^ 2 $ als basis en de groep $ SO (3) $ die oriëntaties definieert als vezel De kat kan kantelen terwijl het impulsmoment wordt behouden door cyclische vervormingen van zijn eigen vorm te gebruiken als gevolg van de kromming van de verbinding die voortkomt uit het idee van parallel transport dat wordt geïmpliceerd door behoud van impulsmoment.
Antwoord
Hier is het meest elementaire voorbeeld van een ijksymmetrie die ik kan bedenken.
Stel dat je t o bespreek enkele mieren die rondlopen op een Möbius-band. Om de posities van de mieren te beschrijven, is het handig om je voor te stellen dat je de band langs de breedte doorsnijdt, zodat het een rechthoek wordt. Dan kun je me vertellen waar een mier is door me drie dingen te vertellen:
- Haar breedtegraad – haar positie langs de breedte van de rechthoek.
- Haar lengtegraad – haar positie langs de lengte van de rechthoek.
- Haar oriëntatie – of ze zich nu vastklampt aan de boven- of onderkant van de rechthoek.
De betekenis van lengtegraad hangt af van de locatie van die denkbeeldige snit. Als je de snede verplaatst, veranderen de lengtes van alle mieren. Er kan geen fysieke reden zijn om de ene snede te verkiezen boven de andere, omdat je de band over de lengte kunt schuiven zonder de vorm te veranderen of het gedrag van de mieren te beïnvloeden. woorden, kan er “geen fysiek betekenisvol begrip van absolute lengtegraad bestaan, omdat de band een vertaalsymmetrie heeft.
Evenzo hangt de betekenis van oriëntatie af van hoe u de oppervlakken labelt van de rechthoek als boven- en onderkant.Er kan geen fysieke reden zijn om de ene etikettering te verkiezen boven de andere, omdat je de twee oppervlakken van de band kunt verwisselen zonder de vorm te veranderen of het gedrag van de mieren te beïnvloeden. Die uitwisseling is een voorbeeld van een ijksymmetrie . Het heeft een aantal opvallende kenmerken die niet worden gedeeld door gewone symmetrieën. Laten we er een van bekijken.
Voor elke symmetrie van een situatie is er een aspect van de situatie dat kan op meerdere manieren worden beschreven, zonder fysieke gronden om ertussen te kiezen. Soms is het echter nuttig om een keuze te maken en je eraan te houden, ook al is de keuze fysiek zinloos. In discussies over mensen die rondzeilen op het aardoppervlak, definieert vrijwel iedereen die ik ken de lengtegraad met een snede die door Greenwich, Londen gaat, vooral omdat sommige mensen die daar in de buurt woonden, namen de wereld over en drukten veel zeekaarten.
Als we op een gewone cilindrische band mieren zouden gaan kijken, hadden we ons kunnen vestigen op een idee van oriëntatie net zo gemakkelijk. We “zouden de ene kant van de band turkoois schilderen voor” bovenkant “en de andere kant blauw voor” onderkant “, en dat zou dat zijn. Op een Möbius-band zijn de zaken ingewikkelder, omdat een Möbius-band maar één kant heeft! je probeert een oppervlak turkoois te schilderen en het tegenoverliggende oppervlak blauw, beginnend in een klein deel van de band en naar buiten bewegend, zullen de turkooizen en blauwe gebieden onvermijdelijk botsen (in onze eerdere bespreking was de botsing verborgen langs de lengtegraad).
In een situatie met een gewone symmetrie, zoals een vertaalsymmetrie, kun je niet kiezen tussen mogelijke beschrijvingen op een manier die fysiek zinvol is. In een situatie met een ijksymmetrie ben je misschien niet eens in staat om te kiezen tussen mogelijke beschrijvingen op een manier die wereldwijd consistent is! U kunt echter altijd voor consistente beschrijvingen kiezen in kleine ruimtes. Daarom worden ijksymmetrieën vaak lokale symmetrieën genoemd.
Na een lange, elementaire beschrijving te hebben geprobeerd van wat een ijksymmetrie is, zou ik het ook graag willen aanbieden een korte, verfijnde. In onze eenvoudigste fysieke modellen vinden gebeurtenissen plaats op een gladde variëteit genaamd ruimte of ruimtetijd . Een gewone symmetrie is een diffeomorfisme van ruimtetijd dat de fysieke mogelijkheid van gebeurtenissen behoudt. In meer geavanceerde modellen vinden evenementen plaats op een vezelbundel gedurende ruimtetijd. Een ijksymmetrie is een automorfisme van de vezelbundel die de fysieke mogelijkheid van gebeurtenissen behoudt.
In ons elementaire voorbeeld speelt de Möbius-band de rol van de ruimte, en lopen de mieren rond in de bands oriëntatiebundel. De oriëntatiebundel heeft een automorfisme dat de twee oppervlakken van de band uitwisselt.
In klassiek elektromagnetisme speelt Minkowski-ruimtetijd of een ander Lorentzisch spruitstuk de rol van ruimtetijd, en het elektromagnetische veld wordt weergegeven door een verbinding op een cirkelbundel over ruimtetijd. In de Kaluza-Klein-afbeelding bewegen geladen deeltjes in de cirkelbundel en vliegen in rechte lijnen waarvan de “schaduwen” in ruimtetijd zijn de spiraalvormige paden die we zien. De cirkelbundel heeft een familie van automorfismen die de cirkelvezels roteren, die chique mensen een $ \ operatornaam {U} (1) $ gauge symmetrie noemen. Deze afbeelding generaliseert naar alle klassieke Yang-Mills-theorieën.
In de Palatini-afbeelding van de algemene relativiteitstheorie, een vloeiend $ 4 $ -dimensionaal spruitstuk speelt de rol van ruimtetijd, en het zwaartekrachtveld wordt weergegeven door een $ \ operatornaam {SO} (3,1) $ aansluiting op de framebundel van het verdeelstuk. Ik vermoed dat de ijksymmetrieën van gelineariseerde zwaartekracht die u noemde automorfismen zijn van de framebundel.
In Einsteins beeld van de algemene relativiteitstheorie zijn de symmetrieën diffeomorfismen van de ruimtetijd. Ik classificeer deze eerder als gewone symmetrieën. dan ijksymmetrieën. Zoals tparker al zei , gebruikt niet iedereen de term “ijksymmetrie” echter op dezelfde manier.
Opmerkingen
- Geweldig! Het M ö bius band idee is gewoon prachtig, en het bevat echt de essentie van veel meer gecompliceerde ideeën. Wat Ik vind het ook leuk dat de stroom van ideeën laat zien hoe het simpele naadloos generaliseert.
- Hé, wat ‘ s met de drie stemmen? Weet je niet wat ‘ s verkeerd met de loeraars op deze site, dit is het beste antwoord op deze vraag tot nu toe, gezien de OP ‘ s vereisten. Hoe dan ook, een van de stemmen is van mij.
- @WetS avannaAnimalakaRodVance, ik zou ‘ me geen zorgen maken over het aantal stemmen. Als u iemand ontmoet die mogelijk baat heeft bij dit antwoord, kunt u hem er rechtstreeks aan koppelen.Ter referentie: het werkt net zo goed onderaan de op stemmen gesorteerde antwoordlijst als bovenaan.
Answer
Er is een zeer interessante fysieke interpretatie van de ijkinvariantie in het geval van $ U (1) $ symmetrie. Metingsymmetrie is de enige manier om een Lorentz-invariante interactie te verkrijgen van de materie (in brede zin – het veld van willekeurige spin) en fotonen (zijnde massaloze deeltjes met heliciteit 1), die afneemt als $ \ frac {1} {r ^ { 2}} $ op grote afstanden (deze bewering is niets anders dan de wet van Coulomb). In het kort, 4-potentiële $ A _ {\ mu} $, die de omgekeerde kwadratische wet van EM-interacties oplevert, is niet Lorentz-covariant, en de manifestatie van Lorentz-onveranderlijkheid van interactie leidt tot lokale conservatie.
uit zeer algemene overwegingen, gebaseerd op de symmetrie van onze ruimte-tijd, kan worden aangetoond dat fotonen worden gepresenteerd door de antisymmetrische 4-tensor $ F _ {\ mu \ nu} $, genaamd EM-sterkte-tensor . Het is formeel Lorentz-covariant (door naïeve manipilaties met tensor-indices te gebruiken) en door constructie (als het veld dat deeltjes met heliciteit 1 vertegenwoordigt), dwz onder Lorentz-transformatie gegeven door matrix $ \ Lambda _ {\ mu} ^ {\ \ nu} $ wordt getransformeerd als $$ F _ {\ mu \ nu} \ naar \ Lambda _ {\ mu} ^ {\ \ alpha} \ Lambda _ {\ nu} ^ {\ \ beta} F _ {\ alpha \ beta} $$ Stel vervolgens dat we materievelden $ \ psi $ hebben en een interactie van materie met fotonen bespreken. De meest voor de hand liggende manier om een dergelijke interactie te krijgen, is deze te verkrijgen door het construeren van alle mogelijke windingen van $ F _ {\ mu \ nu} $ met materievelden en Lorent-covariante objecten (Dirac-matrices, Levi-Civita-verbinding enz.). Stel dat we ook uit het experiment weten dat de interactie op grote afstand als $ \ frac {1} {r ^ {2}} $ afneemt. Helaas is dit onmogelijk als we $ F _ {\ mu \ nu} $ gebruiken. De formele reden is dat de propagator van dit veld, waarin de interactiewet staat, sneller valt dan $ \ frac {1} {r ^ {2}} $. Dit komt doordat twee indices en antisymmetrie van $ F _ {\ mu \ nu} $.
We kunnen een hint geven en object $ A _ {\ mu} $ introduceren met één index, genaamd 4-potentieel : $$ F _ {\ mu \ nu} = \ partieel _ {\ mu} A _ {\ nu} – \ partieel _ {\ nu} A _ {\ mu} $$ Interacties worden nu geconstrueerd door convoluties van $ A_ { \ mu} $ met materievelden en andere covariante objecten.
Natuurlijk vereisen we dat $ A _ {\ mu} $ zowel massaloze heliciteits 1-deeltjes vertegenwoordigt als $ F _ {\ mu \ nu} $. Helaas leidt deze vereiste tot de stelling dat 4-potentiaal niet “t Lorentz-covariant is (hoewel dat formeel wel het geval is, natuurlijk). Precies onder Lorentz transformatieveld $ A _ {\ mu} $, waarvan wordt aangenomen dat het heliciteit 1 massaloze deeltjes vertegenwoordigt, wordt gewijzigd als $$ \ tag 1 A _ {\ mu} \ naar \ Lambda _ {\ mu} ^ {\ \ nu} A _ {\ nu} + \ gedeeltelijke _ {\ mu} \ varphi $$ We zien dat het geen Lorentz-covariant is. De gratis lagrangian voor $ A _ {\ mu} $, wat slechts $$ L = – \ frac {is 1} {4} F _ {\ mu \ nu} F ^ {\ mu \ nu}, $$ is Lorentz-invariant.
Maar er is een manier om Lorentz-invariantie van interacties te behouden. Op deze manier construeer ze om invariant te zijn onder transformatie $ A _ {\ mu} \ naar A _ {\ mu} + \ partieel _ {\ mu} \ varphi $. Precies de amplitude van interactie $ M _ {\ mu_ {1} … \ mu_ {n}} (p_ {i}, \ epsilon_ {j} (k_ {j})) $, waar $ \ epsilon $ fotonheliciteitsvectoren (polarisatie) zijn, $ p_ {i} $ zijn allemaal momentums van interactie deeltjes en $ k_ {j} $ zijnde momenta van fotonen), moet b e invariant onder transformatie $$ \ tag 2 \ epsilon _ {\ mu} (p) \ to \ epsilon _ {\ mu} (p) + \ alpha p _ {\ mu} $$ Over de formele taal, zoals die kan worden weergegeven door het behandelen van processen met emissie van zachte fotonen (fotonen met bijna nul momenta), dit betekent dat er een behoudswet moet zijn van materie koppelingen $ g_ {i} $: $$ g_ {1} + g_ {2} + … = \ text {const} $$ Dit is niets anders dan de wet op het behoud van kosten. Samen met $ (2) $ is dit niets anders dan $ U (1) $ ijksymmetrie.
We zien dus dat de Lorentz-invariantie van interacties van fotonen met materie door inverse kwadratenwet leidt tot ijkinvariantie. Analoog kan het equivalentieprincipe worden beargumenteerd voor het geval van interactie van gravitonen met alle velden.
Antwoord
Gauge-theorieën beschrijven de connectiviteit van een ruimte met kleine, symmetrische extra afmetingen
Begin met een oneindige cilinder (het directe product van een lijn en een kleine cirkel). De cilinder kan worden gedraaid. Om te voorkomen dat ik een beroep doe op concepten die ik probeer uit te leggen, zeg ik alleen dat de cilinder is gemaakt van gaas: cirkels met gelijke tussenruimte gesoldeerd aan draden die over de hele lengte ervan lopen. De lange draden kunnen als een eenheid roteren, waardoor een hoekverdraaiing tussen elk paar aangrenzende cirkels ontstaat. Het is duidelijk dat een dergelijke configuratie continu kan worden vervormd tot een andere: al deze cilinders zijn equivalent vanuit het perspectief van de spreekwoordelijke mier die erop kruipt.
Vervang de lijn door een gesloten lus, zodat het product een torus is (en beschouw de torus als een mesh-ring, hoewel het vlak van de kleine cirkels zo variëren, technisch gezien de analogie breekt). Elk deel van de donut, afgezien van het hele ding, kan worden vervormd tot hetzelfde deel van een andere donut, maar de donuts als geheel kunnen dat soms niet zijn, omdat de netwinding rond de donut niet kan worden gewijzigd. De klassen van equivalente donuts worden volledig gekenmerkt door deze netto-twist, die inherent niet-lokaal is.
Vervang de lus (niet de kleine cirkel) door een verdeelstuk van twee of meer dimensies. Het is waar, hoewel niet voor de hand liggend, dat het fysieke deel van de verbinding volledig wordt gevormd door de geïntegreerde twist rond alle gesloten lussen ( Wilson-lussen ).
$ A $ en $ F $ kwantificeren de connectiviteit
In het discrete geval kan de verbinding het eenvoudigst worden beschreven door de twist tussen aangrenzende cirkels te geven. In de continuümlimiet wordt dit een “twistgradiënt” bij elke cirkel. Dit is $ A_ \ mu $, het zogenaamde vectorpotentiaal.
Elke continue vervorming kan worden beschreven door een scalair veld $ \ phi $ dat de hoeveelheid vertegenwoordigt die elke cirkel is gedraaid (ten opzichte van waar het voorheen was). Dit verandert $ A_ \ mu $ met de gradiënt van $ \ phi $, maar verandert geen fysieke grootheid (lusintegraal).
De beschrijving in termen van Wilson-loops, $ \ oint_ \ gamma A \ cdot \, \ mathrm dx $, is eleganter omdat het alleen fysiek betekenisvolle hoeveelheden bevat, maar het is niet-lokaal en zeer redundant. Als de ruimte eenvoudig is verbonden, kunt u vermijden de r edundantie en niet-lokaliteit door de twist alleen rond differentiële lussen te specificeren, aangezien daaruit grotere lussen kunnen worden gebouwd. De zogenaamde veldtensor, $ \ partiële_ \ nu A_ \ mu – \ partiële_ \ mu A_ \ nu = F _ {\ mu \ nu} $, geeft u precies dat.
(Als de spatie is niet simpelweg verbonden, je kunt nog steeds wegkomen met de differentiële lussen plus één netto twist voor elk element van een generatorset van de fundamentele groep . De torus was natuurlijk een eenvoudig voorbeeld hiervan.)
De kracht komt van het Aharonov-Bohm-effect
Beschouw een scalair veld gedefinieerd over de hele ruimte (in tegenstelling tot de eerdere velden, neemt dit een waarde op elk punt op elke cirkel). Het veld is overal nul behalve twee smalle bundels die van een punt afwijken en ergens anders weer samenkomen. (Misschien worden ze weerkaatst door spiegels; misschien is de ruimte positief gekromd; het maakt niet uit.)
Tenzij het veld constant is over de cirkels, hangt het interferentiegedrag van de bundels af van het verschil in de twist langs de twee paden. Dit verschil is slechts de integraal rond de gesloten lus die wordt gevormd door de paden.
Dit is het (gegeneraliseerde) Aharonov-Bohm-effect. Als je het beperkt tot differentieel verschillende paden en $ F _ {\ mu \ nu} $ gebruikt om het effect op de interferentie te berekenen, krijg je de elektromagnetische krachtwet.
Je kunt het veld ontleden in Fourier-componenten. Het Fourier-spectrum is discreet in de kleine dimensie. De nulde (constante) harmonische wordt niet beïnvloed door het draaien. De tweede harmonische wordt twee keer zo sterk beïnvloed als de eerste. Dit zijn de elektrische ladingen.
In werkelijkheid lijken om onbekende redenen alleen bepaalde extra-dimensionale harmonischen te bestaan. Als alleen de eerste harmonische bestaat, is er een equivalente beschrijving van het veld als een enkele complexe amplitude + fase op elk punt van de grote dimensies. De fase is relatief ten opzichte van een willekeurig lokaal nulpunt dat ook wordt gebruikt door de vectorpotentiaal. Als je de fase vergelijkt met de fase op een punt in de buurt, en er is een vectorpotentieel twist van $ \ mathrm d \ theta $ tussen hen, dan moet je de veldwaarde aanpassen met $ i \, \ mathrm d \ theta $ . Dit is de oorsprong van de gauge covariante afgeleide .
Cirkels generaliseren naar andere vormen
Als u de cirkels met 2-bollen, dan krijg je een $ \ mathrm {SU} (2) $ ijktheorie. Het is numeriek moeilijker: de symmetriegroep is niet-commutatief, dus je moet de machinerie van Lie-algebra inbrengen. Geometrisch echter niets er is veel veranderd. De connectiviteit wordt nog steeds beschreven door een netto draai rond lussen.
Een ongelukkig verschil is dat de beschrijving van lading als extra-dimensionale harmonie cs werkt niet helemaal meer. Sferische harmonischen geven je alleen de integer-spin representaties, en alle bekende deeltjes staan in de spin-0 of spin-½ representaties van het standaardmodel $ \ mathrm {SU} (2) $, dus de deeltjes die worden beïnvloed door de $ \ mathrm {SU} (2) $ force kan helemaal niet op deze manier worden beschreven. Er kan een manier zijn om dit probleem te omzeilen met een meer exotisch type veld.
Ik heb niets verhelderends te zeggen over het $ \ mathrm {SU} (3) $ -deel van de standaardmodelmetergroep, behalve om erop te wijzen dat de hele SM-metergroep kan worden ingebed in $ \ mathrm {Spin} (10) $ , en ik denk dat het gemakkelijker is om een 9-bol te visualiseren dan een vorm met $ \ mathrm {SU} (3) $ symmetrie.
Algemene relativiteitstheorie is vergelijkbaar
In de algemene relativiteitstheorie is de Riemann-krommingstensor analoog aan de veldtensor; het vertegenwoordigt de hoekrotatie van een vector die rond een differentiële lus wordt getransporteerd. Het Aharonov-Bohm-effect is analoog aan het hoekdeficit rond een kosmische string . Kaluza-Klein-theorie verwees oorspronkelijk naar een specifieke manier om elektromagnetisme uit de algemene relativiteitstheorie te halen in vijf dimensies; nu verwijst het vaak naar het brede idee dat de ijkkrachten van het standaardmodel en de algemene relativiteitstheorie waarschijnlijk verschillende aspecten van hetzelfde zijn.
Antwoord
In Classical Electrodynamics (CED) betekent de ijkinvariantie onafhankelijkheid van de elektrische en magnetische velden van een bepaalde “keuze” van de potentialen $ \ varphi $ en $ \ bf {A} $. De vergelijking voor potentialen hangt natuurlijk af van de specifieke keuze van de “ijkmaat”, en ze geven verschillende oplossingen voor verschillende meters.
In QM en QED betekent de ijkinvariantie ook “onveranderlijkheid” van de vorm van vergelijkingen (de oplossingen zijn nog steeds verschillend, maar fysiek equivalent).
Maar men moet binnen blijven Houd er rekening mee dat elke nuttige variabele verandering ook acceptabel is als de overeenkomstige resultaten fysiek hetzelfde blijven. Daarvoor zou de vorm van vergelijkingen helemaal niet “invariant” moeten zijn.