Jag är matematikstudent med ett hobbyintresse för fysik. Det betyder att jag ”har tagit doktorandkurser i kvantdynamik och allmän relativitet utan huvuddelen av grundkurser i fysik och stor volym utbildning i de fysiska verktyg och tankesätt som de andra studenterna som tog kursen hade, liksom Noether” sats, Lagrangian och Hamiltonian mekanik, statistiska metoder och så vidare.
Kurserna gick tillräckligt bra. Min matematiska erfarenhet kompenserade mer eller mindre för en bristande fysisk förståelse. Jag har emellertid fortfarande inte hittat en elementär förklaring av måttinvarians (om det finns något sådant). Jag är medveten om några exempel, som hur den magnetiska potentialen är unik endast upp till en (tid -) konstant gradient. Jag stötte också på det i linjär generell relativitet, där det finns flera olika störningar i rymdtidsmetriket som ger samma observerbara dynamik.
Men för att verkligen förstå vad som händer, Jag gillar att ha enklare exempel. Tyvärr har jag inte kunnat hitta några. Jag antar att eftersom ”gauge invariance” är en så skrämmande fras, så använder ingen det ordet när man skriver till en gymnasieelever.
Så, min ( mycket enkel) frågan är: I många gymnasiefysikberäkningar mäter eller beräknar du tid, avstånd, potentiell energi, temperatur och andra mängder. Dessa beräkningar beror ofta bara på skillnaden mellan två värden, inte själva de konkreta värdena. Du är därför fri att välja en noll efter eget tycke. Är detta ett exempel på måttinvarians i samma mening som examenexemplen ovan? Eller är dessa två olika begrepp?
Kommentarer
- Om du gillar den här frågan kanske du också tycker om att läsa det här Phys.SE-inlägget.
- John Baez skriver : ” Mätprincipen säger i enkla termer att du bara kan säga om två partiklar är i samma tillstånd om du flyttar dem bredvid varandra så att du kan jämföra dem. Att utarbeta de matematiska konsekvenserna av denna princip leder till mätteorier som förklarar de krafter vi ser i naturen. ”
Svar
Anledningen till att det är så svårt att förstå vad fysiker menar när de pratar om ”måttfrihet” är att det finns minst fyra ojämlika definitioner som jag har sett använda :
-
Definition 1: En matematisk teori har en måttfrihet om några av de matematiska frihetsgraderna är ”överflödiga” i den meningen att två olika matematiska uttryck beskriver exakt samma fysiska system . Då är de överflödiga (eller ”måttberoende”) frihetsgraderna ”opysiska” i den meningen att inget möjligt experiment unikt kunde bestämma deras värden, även i princip. Ett känt exempel är den övergripande fasen i ett kvanttillstånd – det är helt omätbart och två vektorer i Hilbert-rymden som bara skiljer sig åt av en övergripande fas beskriver exakt samma tillstånd. Ett annat exempel, som du nämnde, är vilken typ av potential som helst differentieras för att ge en fysisk kvantitet – till exempel en potentiell energifunktion. (Även om några av dina andra exempel, som temperatur, inte är exempel på mätberoende mängder, eftersom det finns en väldefinierad fysisk känsla av noll temperatur.)
För fysiska system som beskrivs av matematiska strukturer med en mätfrihet är det bästa sättet att matematiskt definiera en specifik fysisk konfiguration som en ekvivalensklass av mätberoende funktioner som bara skiljer sig åt i deras mätningsfrihetsgrad. Till exempel, i kvantmekanik, beskrivs inte ett fysiskt tillstånd faktiskt av en enda vektor i Hilbert-rymden, utan snarare av en ekvivalensklass av vektorer som skiljer sig med en övergripande skalär mul tippel. Eller enklare, med en linje av vektorer i Hilbert-rymden. (Om du vill bli snygg kallas utrymmet för fysiska tillstånd ett ”projektivt Hilbert-utrymme”, vilket är linjesatsen i Hilbert-rummet, eller mer exakt en version av Hilbert-rummet där vektorer identifieras om de är proportionella till varandra.) Jag antar att ni också kan definiera ”fysiska potentiella energier” som uppsättningar av potentiella energifunktioner som endast skiljer sig åt med en tillsats konstant, även om det i praktiken är en typ av överdrift. Dessa ekvivalensklasser tar bort måttfriheten genom konstruktion, och så är ”gauge invariant.”
Ibland (men inte alltid) finns det en enkel matematisk operation som tar bort alla överflödiga frihetsgrader samtidigt som alla fysiska bevaras. Till exempel, med tanke på en potentiell energi, kan man ta lutningen för att ge ett kraftfält, som är direkt mätbart.Och när det gäller klassisk E & M, finns det vissa linjära kombinationer av partiella derivat som minskar potentialerna till direkt mätbara $ {\ bf E} $ och $ {\ bf B} $ fält utan att förlora någon fysisk information. I fallet med en vektor i ett kvant Hilbert-utrymme finns det ingen enkel derivatoperation som tar bort fasfriheten utan att förlora något annat.
-
Definition 2: Samma som definition 1, men med det ytterligare kravet att de överflödiga frihetsgraderna är lokala . Vad detta betyder är att det finns någon form av matematisk operation som beror på en godtycklig smidig funktion $ \ lambda (x) $ på rymdtid som lämnar de fysiska frihetsgraderna (dvs. de fysiskt mätbara storheterna) invarianta. Det kanoniska exemplet är naturligtvis att om du tar någon smidig funktion $ \ lambda ( x) $ och sedan lägga till $ \ partial_ \ mu \ lambda (x) $ till den elektromagnetiska fyrpotentialen $ A_ \ mu (x) $ lämnar de fysiska kvantiteterna ($ {\ bf E} $ och $ {\ bf B } $ fält) oförändrade. (I fältteori formuleras kravet att ”fysiska frihetsgrader” är oförändrade så att det kräver att den lagrangiska densiteten $ \ mathcal {L} [\ varphi (x)] $ är oförändrad , men andra formuleringar är möjliga.) Denna definition är helt klart mycket strängare – exemplen ovan i definition 1 räknas inte under denna definition – och mest av tiden när fysiker talar om ”måttfrihet” detta är den definition de menar. I det här fallet har du ett ständigt oändligt antal istället för att ha bara några överflödiga / opysiska frihetsgrader (som den totala konstanten för din potentiella energi). (För att göra saken ännu mer förvirrande använder vissa människor frasen ”global gauge symmetry” i betydelsen Definition 1 för att beskriva saker som den globala fasfriheten för ett kvanttillstånd, vilket tydligt skulle vara en motsägelse i termer i betydelsen Definition 2.)
Det visar sig att för att hantera detta i kvantfältsteorin måste du väsentligt ändra din inställning till kvantisering (tekniskt måste du ”mäta fixa din vägintegral”) för att för att eliminera alla opysiska grader av frihet. När människor talar om ”gauge invariant” -mängder under denna definition menar de i praktiken vanligtvis de direkt fysiskt mätbara derivaten, som den elektromagnetiska tensorn $ F _ {\ mu \ nu} $, som förblir oförändrade (”invariant”) under alla mätomvandlingar . Men tekniskt sett finns det också andra mått-invarianta mängder, t.ex. en enhetlig kvantöverlagring av $ A_ \ mu (x) + \ partial_ \ mu \ lambda (x) $ över alla möjliga $ \ lambda (x) $ för vissa $ A_ \ mu (x). $
Se Terry Taos blogginlägg för en utmärkt förklaring av denna andra känsla av gauge-symmetri ur ett mer matematiskt perspektiv.
-
Definition 3: En Lagrangian sägs ibland ha en ”gauge symmetry” om det finns någon operation som beror på en godtycklig kontinuerlig funktion på rymdtiden som gör att den är oförändrad, även om frihetsgraderna ändras är fysiskt mätbara.
-
Definition 4: För en ”gittermätteori” definierad på lokala gitter Hamiltonians finns det en operatör som stöds på varje gitterplats som pendlar med Hamiltonian. I vissa fall motsvarar denna operatör en fysiskt mätbar kvantitet.
Fallen i definitionerna 3 och 4 är lite begreppsmässigt subtila så jag kommer inte att gå till dem här – jag kan adressera dem i en följd -fråga om någon är intresserad.
Uppdatering: Jag har skrivit uppföljningssvar om huruvida det finns någon mening där frihetsgraderna kan vara fysiskt mätbara i Hamilton-fallet och Lagrangianfallet .
Kommentarer
- Utmärkt svar! Detta är en av de bästa explantionerna (på ett enda ställe) jag har stött på än !!!! : D
- Ive ställde uppföljningsfrågan om finesser mellan # 3 och # 4
- physics.stackexchange.com/q/ 267175/122066
- @ user122066 Se uppdateringen i slutet av mitt svar för länkar till mina uppföljningar.
Svar
Jag förstod det först efter att ha tagit en klass i allmän relativitet (GR), differentiell geometri och kvantfältsteori (QFT). Kärnan är bara en förändring av koordinatsystem som måste återspeglas i derivatet. Jag ska förklara vad jag menar.
Du har en teori som är invariant under någon symmeturgrupp. Så i kvantelektrodynamik har du en lagrangisk densitet för fermionerna (inga fotoner ännu) $$ \ mathcal L = \ bar \ psi (x) [\ mathrm i \ gamma ^ \ mu \ partial_ \ mu – m] \ psi (x) \,. $$ Denna $ \ bar \ psi $ är bara $ \ psi ^ \ dolk \ gamma ^ 0 $, viktigt är att den är komplex konjugerad.Det faktum att det är en fyrvektor i spin-space är inget som bekymrar här. Vad man kan göra nu är att förvandla $ \ psi \ till \ exp (\ mathrm i \ alpha) \ psi $ med några $ \ alpha \ i \ mathbb R $. Sedan kommer $ \ bar \ psi \ till \ bar \ psi \ exp (- \ mathrm i \ alpha) $ och Lagrangian att vara invariant eftersom derivatet inte verkar på den exponentiella funktionen, det är bara en fasfaktor. Där har du en global symmetri.
Markera nu symmetrin till en lokal, varför inte? I stället för en global $ \ alpha $ har man nu $ \ alpha (x) $. Det betyder att vi väljer olika $ \ alpha $ vid varje punkt i rymdtiden. Problemet är att när vi transformerar nu plockar man upp $ \ partial_ \ mu \ alpha (x) $ med kedjan och produktreglerna för differentiering. Det verkar som en teknisk komplikation i början.
Det finns ett mer talande sätt att se detta:
Du tar ett derivat av ett fält $ \ psi (x) $. Detta innebär att man tar en skillnadskvot som $$ \ partial_ \ mu \ psi (x) = \ lim _ {\ epsilon \ till 0} \ frac {\ psi (x + \ epsilon \ vec e_ \ mu) – \ psi (x) } {\ epsilon} \,. $$ Detta fungerar bra med en global transformation. Men med den lokala omvandlingen subtraherar du i princip två värden som mäts annorlunda. I differentiell geometri har du att tangentutrymmena vid grenrörets olika punkter är olika och därför kan man inte bara jämföra vektorer efter deras komponenter. Man behöver en anslutning med anslutningskoefficienter för att tillhandahålla parallell transport . Det är liknande här. Vi har nu befordrat $ \ phi $ från att leva på $ \ mathbb R ^ 4 $ till att bo i bunten $ \ mathbb R ^ 4 \ gånger S ^ 1 $ eftersom vi har en U (1) mätgrupp. Därför behöver vi någon form av anslutning för att transportera den transformerade $ \ phi $ från $ x + \ epsilon \ vec e_ \ mu $ till $ x $. Det är här man måste införa någon anslutning som är $$ \ partial_ \ mu \ till \ mathrm D_ \ mu: = \ partial_ \ mu + \ mathrm i A_ \ mu \,. $$
Om du ansluter det till Lagrange-densiteten för att göra det $$ \ mathcal L = \ bar \ psi (x) [\ mathrm i \ gamma ^ \ mu \ mathrm D_ \ mu – m] \ psi (x) $$ och välj sedan $ A_ \ mu = \ partial_ \ mu \ alpha $ kommer du att se att den lagrangiska densiteten förblir oförändrad även under lokala omvandlingar, eftersom anslutningskoefficienten bara subtraherar den oönskade termen från produkt / kedjeregeln.
I allmän relativitet har du symmetrin under godtycklig diffeomorfism, priset är att du måste ändra derivatet till en anslutning, $$ \ partial \ till \ nabla: = \ partial + \ Gamma + \ cdots \,. $$
Svar
Eftersom du nämnde kommer från en matematisk bakgrund kan det vara trevligt att ta ett svar när det gäller ekvivalensklasser.
En mätteori är fysisk teori där de observerbara mängderna, som i, saker du kan mäta med ett experiment med perfekt mätutrustning, är ekvivalensklasser i ett vektorutrymme.
Elektromagnitism är det vanligaste exemplet. Moderna fysikteorier skrivs alltid som fiberbuntar där det underliggande grenröret är rymdtid och fibrerna är något tangentutrymme associerat med varje punkt (kallas en händelse) under rymdtiden. E & M i ledigt utrymme (inga laddningar närvarande) beskrivs genom att associera ett 4-komponentobjekt som heter $ A _ {\ mu} $ till varje rumstidspunkt, $ x $, och kräver $ A _ {\ mu} (x) $ för att tillfredsställa maxwells ekvationer.
De observerbara, lika mätbara storheterna i naturen är dock de elektriska och magnetiska fälten, $ \ vec {E} (x) $ och $ \ vec {B} (x) $. Dessa härleds från $ A _ {\ mu} (x) $ med den definition som ges i denna wiki (titta på matriselementen för $ F _ {\ mu \ nu} (x) $).
Det visar sig att transformationen $ A _ {\ mu} (x) \ rightarrow A _ {\ mu} (x) + \ partial _ {\ mu} f (x) $ för varje två gånger differentierbar funktion $ f (x) $ ger samma värden för de observerbara fälten $ \ vec {E} (x) $ och $ \ vec {B } (x) $. Så det finns en ekvivalensrelation
$ A _ {\ mu} (x) \ approx A _ {\ mu} (x) + \ partial _ {\ mu} f (x) $ .
Och i allmänhet är mätteorier teorier där de observerbara storheterna är funktioner på ekvivalensklasser för vissa vektorer i ett vektorutrymme. i det här fallet var våra vektorer $ A _ {\ mu} (x) $ (dessa är vektorer i funktionsutrymmet för två gånger differentierbara funktioner på rymdtid), och vår ekvivalensrelation gavs ovan.
När det gäller din slutliga frågan om huruvida saker som systemets totala energi endast bestäms upp till konstant faktor i någon referensram gör Newtons dynamik till en mätteori. Svaret är nej, inte riktigt. I grund och botten, om du inte talar om en fältteori, kommer en fysiker inte att kalla saken en mätteori.
Kommentarer
- Snyggt svar, men kanske skulle det vara mer exakt att säga att observerbara i en mätteori är funktioner på en uppsättning ekvivalensklasser av [saker som anslutningar och buntavsnitt] mod gauge ekvivalens.Frustrationen med måttteori är att vi inte kan känna till ’ om många fall där vi kan beskriva dessa funktioner förutom genom att ge funktioner på anslutningarna och sektionerna.
- Du har rätt, mitt språk är lite slarvigt. Det borde läsa ungefär som ” observationer är funktioner på ekvivalensklasserna för något vektorutrymme. ”
Svar
Mätarvariation är helt enkelt en redundans i beskrivningen av ett fysiskt system. Dvs vi kan välja mellan ett oändligt antal vektorpotentialer i E & M.
Till exempel kan ett oändligt antal vektorpotentialer beskriva elektromagnetism genom transformationen nedan
$$ A (x) \ till A_ \ mu (x) + \ partial_ \ mu \ alpha (x) $$
Att välja en specifik mätare (måttfixering) kan göra lösningen ett fysiskt problem mycket lättare än det skulle vara om du inte fixade en mätare.
Normalt väljer man Coulomb-mätaren: $ \ nabla \ cdot A = 0 $.
Det borde var betonad att måttinvarians INTE är en symmetri av naturen och att du inte kan mäta någonting associerat med den.
Mätinvarians är mest användbar i kvantfältsteorin och är avgörande för att bevisa renormaliserbarhet. Dessutom kräver S-matriselement i QFT en lokal lagrangiansk och därmed måttlig invarians.
Som ett exempel på varför vi skulle introducera vektorn potetial $ A ^ \ mu $ överväga Aharonov-Bohm-effekten som uppstår på grund av globala topologiska egenskaper hos vektorpotentialen. Det finns fortfarande andra anledningar till att måttinvarians gör livet enkelt, vilket minskar fotonens frihetsgrad i den så kallade kovarianten eller $ R_ \ xi $ -mätaren, orsakssamband osv. I huvudsak blir användningen av mätinvarians inte helt uppenbar tills man börjar försöka att arbeta igenom kvantfältsteori. : D
Kommentarer
- @ user122066 För framtida referens, om du behöver leta upp en symbol, se denna tex.SE fråga . Men endast vissa (La) TeX-kommandon stöds i MathJax. Se MathJax-dokumentationen för en lista.
- För all MathJax-referens, kontrollera detta: MathJax grundläggande handledning och snabbreferens
- @ user122066: du skrev: ” Nu är det en helt avgörande egenskap hos modern fysik och vi kan mycket väl gå vilse utan det! ” Jag tror att du överdriver här och det är det som gör en sådan fras ” skrämmande ”. Det finns inget bevis för att vi bara måste arbeta med ” mätteorier ”. Andra tillvägagångssätt är bara outforskade.
- @VladimirKalitvianski rättvist nog. Det finns rekursionsrelationer relaterade till S-matrisen som undviker mätare men det ’ är väldigt svårt att föreställa sig att något upptäcks som gör konversation lättare än att mäta invarians. Du har dock helt rätt. Jag raderar den här delen
- (Också användbar för TeX-symbolsökning – Detexify .)
Svar
Dessa beräkningar beror ofta bara på skillnaden mellan två värden, inte själva de konkreta värdena . Du är därför fri att välja en noll efter eget tycke. Är detta ett exempel på måttinvarians i samma bemärkelse som exemplen ovan?
Ja, det är faktiskt, i den mest generella definitionen av måttinvarians, det är vad fysiker kallar en global gauge invariance . Mer om det nedan.
Om jag var tvungen att skriva ett enda svar på din titel skulle det vara detta:
Mätarvarianter är den väl definierade fysiska lagen under en kvotkarta som kondenserar ett konfigurations- / parameterutrymme / koordinater för ett fysiskt system till en uppsättning ekvivalensklasser av fysiskt ekvivalenta konfigurationer.
Detta är i samma bemärkelse som till exempel att coset-produkten är väl definierad under kartan som kvoterar bort en grupps normala undergrupp. Konfigurationens fysik är oberoende av valet av ekvivalensklassmedlem .
I sina kortaste termer är gauge invariance helt enkelt ett påstående att det finns redundans i en matematisk beskrivning av ett fysiskt system. I övrigt har systemet en symmetri , en invarians med avseende på en grupp transformationer.
En global gauge symmetry är en där konfigurationsutrymmet är en enkel kartesisk produkt ( dvs. en trivial fiberbunt) av uppsättningen fysiskt distinkta ekvivalensklasser och en redundant parameter, som med din skillnad mellan två värden exempel. Om den fysiska beskrivningen är en Lagrangian-beskrivning kommer det här att Noeters sats kommer fram och identifierar bevarade mängder, en för varje sådan redundant parameter.Mätgruppen, dvs. grupp av symmetrier, påverkar alla ekvivalensklasser (fibrer) lika. Subtraktion av en konstant potential från en elektrostatisk potential är en sådan symmetri, och ett enormt framsteg för Corvid Civilization, eftersom det låter kråkor sitta på högspänningsledningar och glatt skjuta vinden tillsammans, diskutera sina senaste tankar om mätteorier och förklara att ” Aldrig mer!” ska vi frukta att det globala tillägget av 22kV till den elektrostatiska potentialen kan förändra fysiken i systemet vi tillhör.
Men vanligtvis när fysiker talar om en mätteori, menar de en där symmeturgruppen kan agera på ett mer allmänt sätt, med en annan gruppmedlem som agerar vid varje punkt i konfigurationsutrymmet. Motsvarande fiberbunt är inte längre trivialt. Även om du ville ha ett enklare exempel än elektrodynamik, tror jag inte att det finns en. Fasen som läggs till i elektronvågfunktionen kan vara vilken som helst smidig funktion av koordinaterna, och de extra termer som uppstår från Leibniz-regeln tillämpas på derivaten i vågfunktionens rörelseekvation (Dirac, Schrödinger) sugs upp exakt i den slutna delen av EM-potentialen. För övrigt gillar jag alltid att visualisera EM-potentialen i Fourier-rymden, vilket vi kan göra med rimliga begränsningar ( t.ex. ett postulat som vi bara tänker på till exempel tempererade distributioner) , eftersom den rumsliga delen av den redundanta delen av fyrpotentialen är dess komponent längs vågvektorn ( dvs tänkt som en 3-vektor), och endast den komponent som är normal för vågvektorn spelar fysiskt vikt: det är den enda delen som överlever $ A \ mapsto \ mathrm {d} A = F $.
Det finns två saker som jag tror att du ska ta från EM-exemplet:
-
Även om det praktiskt taget leder till en hel del ytterligare komplexitet, är det begreppsmässigt bara ett litet hopp från ditt enkla globala mått symmetriska exempel; vi tillåter helt enkelt symmetrier att agera lokalt istället för att agera på alla konfigurationsutrymme punkter lika;
-
Att ta en ledning från den experimentellt verkliga elektromagnetismen, postulerar att denna måttvariation m kan vara relevant mer generellt, och så ser vi dess närvaro i andra fysiska fenomen. Detta är inget annat än en handling motiverad av en aning. Experimentellt finner vi att detta är en fruktbar sak att göra. I fysik finns det ingen djupare insikt än experimentella resultat.
Slutligen bör jag nämna att mått- / fiberbuntuppfattningar också är användbara när vi artificiellt förklarar ekvivalensklasser av konfigurationer baserade på behoven hos vårt problem , även om det finns en fysisk skillnad mellan ekvivalensklassmedlemmar. Ett av de vackraste exemplen på detta sätt att tänka är Montgomery ”s ” Gauge Theory of the Falling Cat ”. Vi studerar ekvivalensklasser av kattkonfiguration som är ekvivalenta modulo korrekt euklidisk isometri för att formulera ett kattformutrymme vilket, vid standardbehandlingen där katten betraktas som en tvådelad robot med vridningsfri kulledsförband visar sig vara riktigt projektivt plan $ \ mathbb {RP} ^ 2 $. Hela konfigurationsutrymmet är då ett fiberpaket med formutrymmet $ \ mathbb {RP} ^ 2 $ som bas och gruppen $ SO (3) $ som definierar orienteringar som fiber Katten kan vända samtidigt som den bevarar vinkelmomentet med hjälp av cykliska deformationer av sin egen form på grund av krökningen av anslutningen som uppstår genom begreppet parallell transport som antyds av vinkelmomentbevarande.
Svara
Här är det mest elementära exemplet på en mätarsymmetri jag kan tänka mig.
Antag att du vill ha t o diskutera några myror som går runt på ett Möbius-band. För att beskriva myrornas positioner är det bekvämt att tänka sig att klippa bandet längs dess bredd, så det blir en rektangel. Då kan du berätta var en myra är genom att berätta för mig tre saker:
- Hennes latitud —hennes position längs rektangelns bredd.
- Hennes longitud —hennes position längs rektangelns längd.
- Hennes orientering – om hon håller fast vid rektangelns topp eller bottenyta.
Betydelsen av longitud beror på platsen för det imaginära snittet. Om du flyttar snittet ändras alla myrornas ”longituder. Det kan inte finnas någon fysisk anledning att föredra ett snitt framför ett annat, eftersom du kan skjuta bandet längs dess längd utan att ändra form eller påverka myrornas beteende. I andra ord, det kan inte finnas någon fysiskt meningsfull uppfattning om absolut longitud, eftersom bandet har en översättningssymmetri .
På samma sätt beror betydelsen av orientering på hur du märker ytorna av rektangeln som topp och botten.Det kan inte finnas någon fysisk anledning att föredra en märkning framför en annan, eftersom du kan byta ut de två ytorna på bandet utan att ändra form eller påverka myrornas beteende. Det utbytet är ett exempel på en symmetri för mätare . Den har några slående funktioner som inte delas av vanliga symmetrier. Låt oss titta på en av dem.
För varje symmetri i en situation finns det någon aspekt av situationen. som kan beskrivas på flera sätt utan fysiska skäl för att välja mellan dem. Ibland är det dock bra att göra ett val och hålla fast vid det, även om valet är fysiskt meningslöst. I diskussioner om människor som seglar runt på jorden, till exempel, definierar i stort sett alla jag känner longitud med hjälp av ett snitt som går genom Greenwich, London, främst för att vissa människor som bodde runt där tog över världen och skrev ut en massa nautiska sjökort.
Om vi hade gått och tittat på ett vanligt cylindriskt band kunde vi ha bestämt oss för en uppfattning om orientering lika lätt. Vi målar ena sidan av bandet turkos för ”topp” och den andra sidan blå för ”botten”, och det skulle vara det. På ett Möbius-band är det mer komplicerat, för ett Möbius-band har bara en sida! Om du försöker måla en yta turkos och den motsatta ytan blå, med början i ett litet område av bandet och rör sig utåt, de turkosa och blå områdena kommer oundvikligen att kollidera. (I vår tidigare diskussion gömdes kollisionen längs längdskuren.)
I en situation med en vanlig symmetri, som en översättningssymmetri, kan du inte välja mellan möjliga beskrivningar på ett sätt som är fysiskt meningsfullt. I en situation med en måttsymmetri kanske du inte ens är kunna välja mellan möjliga beskrivningar på ett sätt som är globalt konsekvent! Du kan dock alltid välja konsekventa beskrivningar i små rymdregioner. Därför kallas gauge-symmetrier ofta local symmetries .
Efter att ha försökt en lång, elementär beskrivning av vad en gauge-symmetri är vill jag också erbjuda en kort, sofistikerad. I våra enklaste fysiska modeller sker händelser på ett smidigt grenrör som heter space eller spacetime . En vanlig symmetri är en diffeomorfism av rymdtid som bevarar den fysiska möjligheten till händelser. I mer sofistikerade modeller äger händelser rum på ett fiberpaket under rymdtiden. En gauge-symmetri är en automorfism av fiberknippet som bevarar den fysiska möjligheten till händelser.
I vårt elementära exempel spelar Möbius-bandet rollen som rymden och myrorna går runt i bandets Orienteringspaketet. Orienteringspaketet har en automorfism som utbyter bandets två ytor.
I klassisk elektromagnetism spelar Minkowski rymdtid eller någon annan Lorentzian grenrör rollen som rymdtid, och det elektromagnetiska fältet representeras av en anslutning på en cirkelbunt över rymdtid. I Kaluza-Klein-bilden rör sig laddade partiklar runt i cirkelbunten och flyger i raka linjer vars ”skuggor” under rymdtiden är de spiralvägar vi ser. Cirkelpaketet har en familj av automorfismer som roterar cirkelfibrerna, som fina människor kallar $ \ operatorname {U} (1) $ gauge symmetry. Denna bild generaliserar till alla klassiska teorier om Yang-Mills.
I Palatini-bilden av allmän relativitet, en jämn $ 4 $ -dimensionell grenrör spelar rollen som rymdtid, och gravitationsfältet representeras av ett $ \ operatorname {SO} (3,1) $ -anslutning på grenrörets rampaket. Jag misstänker att mätarsymmetrierna för linjär tyngdkraft som du nämnde är automorfismer av rampaketet.
I Einsteins bild av allmän relativitet är symmetrier diffeomorfismer från rymdtiden. Jag klassificerar dessa som vanliga symmetrier, snarare än gauge-symmetrier. Som tparker nämnde använder dock inte alla termen ”gauge symmetry” på samma sätt.
Kommentarer
- Underbart! M ö bius-bandidén är bara vacker, och den fångar verkligen all essensen av mycket mer komplicerade idéer. Jag gillar också att det är hur idéflödet visar hur det enkla generaliserar sömlöst.
- Hej, vad ’ s med de tre rösterna? Inte vad ’ är fel med lurarna på den här webbplatsen, detta är det bästa svaret på den här frågan hittills, med tanke på OP ’ s krav. Hur som helst, en av rösterna är min.
- @WetS avannaAnimalakaRodVance, jag skulle inte ’ t oroa mig för antalet röster. Om du träffar någon som kan dra nytta av det här svaret kan du bara länka dem direkt till det.Som referens fungerar den lika bra längst ner i den röstsorterade svarlistan som högst upp.
Svar
Det finns mycket intressant fysisk tolkning av mätarvariantern i fallet med $ U (1) $ symmetri. Gauge symmetry är det enda sättet att få Lorentz invarianta interaktion mellan materien (i vid bemärkelse – fältet för godtycklig snurrning) och fotoner (som är masslösa partiklar med helicitet 1), vilket minskar som $ \ frac {1} {r ^ { 2}} $ på stora avstånd (detta uttalande är inget annat än Coulomb-lag). Kort sagt, 4-potentiell $ A _ {\ mu} $, som ger inverserad kvadratisk lag av EM-interaktioner, är inte Lorentz-kovariant, och manifestation av Lorentz-invarians av interaktion leder till att ladda lokal bevarande.
Verkligen, Det kan visas från mycket allmänna överväganden, baserat på symmetrin i vår rymdtid, att fotoner presenteras av den antisymmetriska 4-tensor $ F _ {\ mu \ nu} $, kallad EM styrketensor . Det är Lorentz kovariant formellt (genom att använda naiva manipulationer med tensorindex) och genom konstruktion (som fältet som representerar partiklar med helicitet 1), dvs under Lorentz-transformation ges av matrisen $ \ Lambda _ {\ mu} ^ {\ \ nu} $ den transformeras som $$ F _ {\ mu \ nu} \ till \ Lambda _ {\ mu} ^ {\ \ alpha} \ Lambda _ {\ nu} ^ {\ \ beta} F _ {\ alpha \ beta} $$ Antag att vi har materiafält $ \ psi $ och diskuterar en interaktion mellan materia och fotoner. Det mest uppenbara sättet att få sådan interaktion är att få det genom konstruera alla möjliga krånglar på $ F _ {\ mu \ nu} $ med ämnesfält och Lorent-kovarianta objekt (Dirac-matriser, Levi-Civita-anslutning etc.). Antag också att vi vet från experimentet att interaktionen faller ner som $ \ frac {1} {r ^ {2}} $ på stort avstånd. Tyvärr är detta omöjligt om vi använder $ F _ {\ mu \ nu} $. Den formella anledningen är att propagatorn för detta fält, som visar interaktionslagen, faller snabbare än $ \ frac {1} {r ^ {2}} $. Detta beror på att två index och antisymmetri på $ F _ {\ mu \ nu} $.
Vi kan göra en ledtråd och introducera objekt $ A _ {\ mu} $ med ett index, kallat 4-potential : $$ F _ {\ mu \ nu} = \ partial _ {\ mu} A _ {\ nu} – \ partial _ {\ nu} A _ {\ mu} $$ Interaktioner är nu konstruerade av viklingar på $ A_ { \ mu} $ med ämnesfält och andra kovarianta objekt.
Vi kräver naturligtvis att $ A _ {\ mu} $ representerar masslösa helicitetspartiklar 1 samt $ F _ {\ mu \ nu} $. Tyvärr leder detta krav till påståendet att 4-potential inte är Lorentz-kovariant (även om det formellt är det naturligtvis). Exakt, under Lorentz transformationsfältet $ A _ {\ mu} $, som antas representera helicitet 1 masslösa partiklar, ändras som $$ \ tag 1 A _ {\ mu} \ till \ Lambda _ {\ mu} ^ {\ \ nu} A _ {\ nu} + \ partial _ {\ mu} \ varphi $$ Vi ser att det inte är Lorentz-kovariant. Den fria lagrangianen för $ A _ {\ mu} $, som bara är $$ L = – \ frac { 1} {4} F _ {\ mu \ nu} F ^ {\ mu \ nu}, $$ är Lorentz invariant.
Men det finns ett sätt att bevara Lorentz invarians av interaktioner. Detta sätt är att konstruera dem för att vara invarianta under transformation $ A _ {\ mu} \ till A _ {\ mu} + \ partial _ {\ mu} \ varphi $. Exakt, amplituden för interaktionen $ M _ {\ mu_ {1} … \ mu_ {n}} (p_ {i}, \ epsilon_ {j} (k_ {j})) $, där $ \ epsilon $ är fotonhelicitets (polarisations) vektorer, $ p_ {i} $ är alla momentum för interaktion partiklar och $ k_ {j} $ är momenta av fotoner), måste b e invariant under transformation $$ \ tag 2 \ epsilon _ {\ mu} (p) \ to \ epsilon _ {\ mu} (p) + \ alpha p _ {\ mu} $$ På det formella språket, som det kan visas av behandla processer med utsläpp av mjuka fotoner (fotoner med nästan nollmoment), det betyder att det måste finnas bevarande lag för materiekopplingar $ g_ {i} $: $$ g_ {1} + g_ {2} + … = \ text {const} $$ Detta är ingenting annat än lagen om bevarande av avgifter. Tillsammans med $ (2) $ är detta ingenting annat än $ U (1) $ gauge-symmetri.
Så vi ser att Lorentz-invariansen av interaktioner mellan fotoner och materia genom omvänd kvadratisk lag leder till gauge-invarians. Analogiskt kan hävdas ekvivalensprincip för fallet med att interagera med gravitoner med alla fält.
Svar
Mätteorier beskriver anslutningen till ett utrymme med små, symmetriska extra dimensioner
Börja med en oändlig cylinder (den direkta produkten av en linje och en liten cirkel). Cylindern kan vridas. För att undvika att tilltala begrepp som jag försöker förklara, säger jag bara att cylindern är gjord av trådnät: jämnt fördelade cirklar lödda till trådar som löper längs den. De långa trådarna kan rotera som en enhet och introducera en vinklad vridning mellan varje par intilliggande cirklar. Det är tydligt att en sådan konfiguration kontinuerligt kan deformeras till vilken som helst annan: alla sådana cylindrar är ekvivalenta ur perspektivet av den ordspråkiga myra som kryper på dem.
Byt ut linjen med en sluten slinga så att produkten är en torus (och tänk på torusen som en maskdonut, även om det varierar de små cirklarnas plan tekniskt bryter analogin). Varje del av munken som är kort av hela grejen kan deformeras till samma del av vilken annan munk som helst, men munkar som helhet kan ibland inte vara, eftersom nätvridningen runt munken inte kan ändras. Klasserna av motsvarande munkar kännetecknas helt av denna nätvridning, som i sig är icke-lokal.
Byt ut öglan (inte den lilla cirkeln) med ett grenrör med två eller flera dimensioner. Det är sant, men inte uppenbart, att den fysiska delen av anslutningen helt och hållet ges av den integrerade vridningen runt alla slutna slingor ( Wilson-slingor ).
$ A $ och $ F $ kvantifierar anslutningen
I det diskreta fallet kan anslutningen beskrivas enklast genom att ge vridningen mellan intilliggande cirklar. I kontinuumgränsen blir detta en ”twist gradient” vid varje cirkel. Detta är $ A_ \ mu $, den så kallade vektorpotentialen.
Varje kontinuerlig deformation kan beskrivas med ett skalfält $ \ phi $ som representerar mängden som varje cirkel är vriden (relativt varhelst den var tidigare). Detta ändrar $ A_ \ mu $ med gradienten $ \ phi $, men ändrar inte någon fysisk kvantitet (loopintegral).
Beskrivningen i termer för Wilson-slingor, $ \ oint_ \ gamma A \ cdot \, \ mathrm dx $, är mer elegant eftersom det bara innehåller fysiskt meningsfulla kvantiteter, men det är icke-lokalt och mycket överflödigt. Om utrymmet helt enkelt är anslutet kan du undvika r ödmjukhet och icke-lokalitet genom att specificera vridningen endast runt differentiella öglor, eftersom större öglor kan byggas från dem. Den så kallade fälttensorn, $ \ partial_ \ nu A_ \ mu – \ partial_ \ mu A_ \ nu = F _ {\ mu \ nu} $, ger dig exakt det.
(Om utrymmet är inte bara ansluten, du kan fortfarande komma undan med differentialslingorna plus en nettovridning för varje element i en genererande uppsättning av grundläggande grupp . Torus var naturligtvis ett enkelt exempel på detta.)
Kraften kommer från Aharonov – Bohm-effekten
Tänk på ett skalärt fält definierat över hela utrymmet (till skillnad från de tidigare fälten tar den här ett värde vid varje punkt i varje cirkel). Fältet är noll överallt utom två smala balkar som avviker från en punkt och återkonvergerar någon annanstans. (Kanske reflekteras de av speglar; kanske är utrymmet positivt böjt; det spelar ingen roll.)
Om inte fältet är konstant över cirklarna kommer strålens störningsbeteende att bero på skillnaden i vridningen längs de två vägarna. Denna skillnad är bara integralen kring den slutna slingan som bildas av banorna.
Detta är den (generaliserade) Aharonov – Bohm-effekten. Om du begränsar den till olika vägar och använder $ F _ {\ mu \ nu} $ för att beräkna effekten på störningen, får du den elektromagnetiska kraftlagen.
Du kan sönderdela fältet i Fourier-komponenter. Fourier-spektrumet är diskret i den lilla dimensionen. Nollpunkten (konstant) överton påverkas inte av vridningen. Den andra övertonen påverkas dubbelt så mycket som den första. Dessa är de elektriska laddningarna.
I verkligheten verkar det av okända skäl endast vissa extra-dimensionella övertoner. Om bara den första övertonen existerar finns det en ekvivalent beskrivning av fältet som en enda komplex amplitud + fas vid varje punkt med de stora dimensionerna. Fasen är relativt en godtycklig lokal nollpunkt som också används av vektorpotentialen. När du jämför fasen med fasen vid en närliggande punkt och det finns en vektorpotentialvridning på $ \ mathrm d \ theta $ mellan dem, måste du justera fältvärdet med $ i \, \ mathrm d \ theta $ Detta är ursprunget till kovariantderivat .
Cirklar generaliserar till andra former
Om du byter ut cirklar med 2-sfärer får du en $ \ mathrm {SU} (2) $ gauge-teori. Det är snyggare numeriskt: symmetri-gruppen är icke-obligatorisk, så du måste ta in Lie-algebras maskiner. Geometriskt, dock ingenting mycket har förändrats. Anslutningen beskrivs fortfarande av en nätvridning runt öglor.
En olycklig skillnad är att beskrivningen av laddning som extra dimensionell harmoni cs fungerar inte riktigt mer. Sfäriska övertoner ger dig endast heltal-spin-representationerna, och alla kända partiklar finns i spin-0 eller spin-½-representationerna av standardmodellen $ \ mathrm {SU} (2) $, så partiklarna som påverkas av $ \ mathrm {SU} (2) $ kraft alls kan inte beskrivas så här. Det kan finnas ett sätt att kringgå detta problem med en mer exotisk typ av fält.
Jag har inget insiktsfullt att säga om $ \ mathrm {SU} (3) $ -delen av standardmodellmätargruppen förutom att påpeka att hela SM-mätgruppen kan inbäddas i $ \ mathrm {Spin} (10) $ , och jag tror att det är lättare att visualisera en 9-sfär än en form med $ \ mathrm {SU} (3) $ symmetri.
Allmän relativitetsteori liknar
I allmän relativitet är Riemann-krökningstensorn analog med fälttensorn; den representerar vinkelrotationen för en vektor som transporteras runt en differentiell slinga. Aharonov-Bohm-effekten är analog med vinkelunderskottet kring en kosmisk sträng . Kaluza-Klein-teorin hänvisade ursprungligen till ett specifikt sätt att få elektromagnetism från allmän relativitet i fem dimensioner; nu hänvisas det ofta till den breda idén att standardmodellkrafter och allmän relativitet sannolikt kommer att vara olika aspekter av samma sak.
Svar
I klassisk elektrodynamik (CED) betyder mätarvarianternas oberoende av de elektriska och magnetiska fälten från ett visst ”val” av potentialerna $ \ varphi $ och $ \ bf {A} $. Ekvationen för potentialer beror naturligtvis på det specifika valet av ”mätare”, och de ger olika lösningar för olika mätare.
I QM och QED betyder mätinvariansen också ”invarians” av form av ekvationer (lösningarna är fortfarande annorlunda men fysiskt ekvivalenta).
Men man bör hålla i tänk på att alla användbara variabla förändringar är lika godtagbara om motsvarande resultat förblir fysiskt desamma. För det bör formen av ekvationer inte vara obligatorisk alls.