Jsem student matematiky se zájmem o fyziku. To znamená, že jsem absolvoval postgraduální kurzy kvantové dynamiky a obecné relativity bez většiny vysokoškolských kurzů fyziky a čistého objemu výuky fyzikálních nástrojů a myšlení, které měli ostatní studenti, kteří se kurzu zúčastnili, jako Noetherova věta, Lagrangeova a Hamiltonova mechanika, statistické metody atd.

Samotné kurzy proběhly dostatečně dobře. Moje matematické zkušenosti více méně kompenzovaly nedostatek fyzického porozumění. Stále jsem však nenašel základní vysvětlení invariance měřidel (pokud existuje něco takového). Jsem si vědom některých příkladů, například toho, jak je magnetický potenciál jedinečný pouze do (času -) konstantní gradient. Také jsem na něj narazil v linearizované obecné relativitě, kde existuje několik různých narušení metriky časoprostoru, které poskytují stejnou pozorovatelnou dynamiku.

Abych však skutečně pochopil, o co jde, Mám rád jednodušší příklady. Bohužel jsem žádné nenašel. Myslím, že protože „gauge invariance“ je tak děsivá fráze, nikdo toto slovo nepoužívá při psaní studentovi střední školy.

Takže, můj ( velmi jednoduchá) otázka zní: V mnoha výpočtech fyziky na střední škole měříte nebo počítáte čas, vzdálenost, potenciální energii, teplotu a další veličiny. Tyto výpočty velmi často závisí pouze na rozdílu mezi dvěma hodnotami, ne konkrétní hodnoty samy o sobě. Můžete si tedy zvolit libovolnou nulu podle svých představ. Je to příklad invariance měřidel ve stejném smyslu jako výše uvedené příklady absolventa? Nebo jsou to tyto dva odlišné pojmy?

Komentáře

  • Pokud se vám tato otázka líbí, můžete si také přečíst tento příspěvek Phys.SE.
  • John Baez píše : “ Princip měřidla říká jednoduše, že můžete říct jen pokud jsou dvě částice ve stejném stavu, pokud přesunete je vedle sebe, abyste je mohli porovnat. Vypracování matematických důsledků tohoto principu vede k měřicím teoriím, které vysvětlují síly, které vidíme v přírodě. “

Odpovědět

Důvodem, proč je tak těžké pochopit, co mají fyzici na mysli, když hovoří o „měřidlové svobodě“, je, že používám alespoň čtyři nerovné definice, které jsem viděl :

  • Definice 1: Matematická teorie má volnost měřidla, pokud jsou některé z matematických stupňů volnosti „nadbytečné“ v tom smyslu, že dva různé matematické výrazy popisují přesně stejný fyzický systém . Potom jsou nadbytečné (neboli „měřicí závislé“) stupně volnosti „nefyzické“ v tom smyslu, že žádný možný experiment nemohl jednoznačně určit jejich hodnoty, a to ani v zásadě. Jedním slavným příkladem je celková fáze kvantového stavu – je to naprosto neměřitelné a dva vektory v Hilbertově prostoru, které se liší pouze celkovou fází, popisují přesně stejný stav. Dalším příkladem, jak jste zmínil, je jakýkoli druh potenciálu, který musí být rozlišeny tak, aby poskytovaly fyzikální veličinu – například funkci potenciální energie. (Ačkoli některé z vašich dalších příkladů, například teplota, nejsou příklady měřených veličin, protože existuje dobře definovaný fyzikální smysl pro nulovou teplotu.)

    U fyzických systémů, které jsou popsány matematickými strukturami s volností měřidla, je nejlepším způsobem, jak matematicky definovat konkrétní fyzickou konfiguraci, třída ekvivalence funkcí závislých na měřidle, které se liší pouze stupněm volnosti měřidla Například v kvantové mechanice není fyzický stav ve skutečnosti popsán jediným vektorem v Hilbertově prostoru, ale spíše třídou ekvivalence vektorů, které se liší celkovým skalárním množstvím tiple. Nebo jednodušeji linií vektorů v Hilbertově prostoru. (Chcete-li si udělat představu, prostor fyzikálních stavů se nazývá „projektivní Hilbertův prostor“, což je množina čar v Hilbertově prostoru, nebo přesněji verze Hilbertova prostoru, ve které jsou identifikovány vektory, pokud jsou proporcionální. Předpokládám, že byste také mohli definovat „fyzické potenciální energie“ jako množiny funkcí potenciální energie, které se liší pouze aditivní konstantou, i když v praxi je to „přehnané“. Tyto třídy ekvivalence odstraní konstrukci svobodu měřidla, a tak jsou „měřidla neměnná.“

    Někdy (i když ne vždy) existuje jednoduchá matematická operace, která odstraní všechny nadbytečné stupně svobody při zachování všech fyzických. Například vzhledem k potenciální energii lze gradientem získat silové pole, které je přímo měřitelné.A v případě klasických E & M existují určité lineární kombinace parciálních derivací, které snižují potenciály na přímo měřitelné $ {\ bf E} $ a $ {\ bf B} $ pole bez ztráty fyzických informací. V případě vektoru v kvantovém Hilbertově prostoru však neexistuje žádná jednoduchá derivační operace, která odstraní fázovou svobodu bez ztráty čehokoli jiného.

  • Definice 2: Totéž jako Definice 1, ale s dalším požadavkem, aby redundantní stupně volnosti byly místní . To znamená, že existuje nějaký druh matematické operace, která závisí na libovolném hladkém funkce $ \ lambda (x) $ v časoprostoru, která ponechává fyzické stupně volnosti (tj. fyzicky měřitelné veličiny) neměnné. Kanonickým příkladem samozřejmě je, že pokud vezmete libovolnou hladkou funkci $ \ lambda ( x) $, poté přidáním $ \ partial_ \ mu \ lambda (x) $ k elektromagnetickému čtyřpotenciálu $ A_ \ mu (x) $ opustíte fyzické veličiny ($ {\ bf E} $ a $ {\ bf B } $ pole) beze změny. (V teorii pole je požadavek, že „fyzické stupně volnosti“ zůstanou nezměněny, formulován jako požadavek, aby Lagrangeova hustota $ \ mathcal {L} [\ varphi (x)] $ byla nezměněna , ale jsou možné i jiné formulace.) Tato definice je zjevně mnohem přísnější – příklady uvedené výše v definici 1 se pod touto definicí nepočítají – a většinu času, kdy fyzici hovoří o „měřidle svobody“ toto je definice, kterou mají na mysli. V tomto případě místo toho, abyste měli jen několik nadbytečných / nefyzických stupňů volnosti (jako je celková konstanta pro vaši potenciální energii), máte neustále nekonečné číslo. (Aby toho nebylo málo, někteří lidé používají frázi „symetrie globálního měřidla“ ve smyslu definice 1 k popisu věcí, jako je globální fázová svoboda kvantového stavu, což by byl zjevně rozpor ve smyslu definice. 2.)

    Ukazuje se, že k tomu, abychom se s tím vypořádali v teorii kvantového pole, musíte podstatně změnit svůj přístup ke kvantování (technicky je třeba „měřit fixní vaši cestu integrálně“), aby eliminovat všechny nefyzické stupně svobody. Když lidé podle této definice hovoří o „rozměrech invariantních“ veličinách, v praxi to obvykle znamenají přímo fyzicky měřitelné deriváty, jako je elektromagnetický tenzor $ F _ {\ mu \ nu} $, které zůstávají beze změny („invariantní“) při jakékoli transformaci měřidla . Ale technicky existují i další invariantní veličiny, např. jednotná kvantová superpozice $ A_ \ mu (x) + \ částečné_ \ mu \ lambda (x) $ přes všechny možné $ \ lambda (x) $ pro konkrétní $ A_ \ mu (x). $

    Skvělé vysvětlení tohoto druhého smyslu symetrie měřidel naleznete v příspěvku blogu Terryho Taa z matematičtější perspektivy.

  • Definice 3: O Lagrangeově se někdy říká, že má „symetrii měřidla“, pokud existuje nějaká operace, která závisí na libovolné spojité funkci v časoprostoru, která jej ponechá neměnný, i když se stupně volnosti mění jsou fyzicky měřitelné.

  • Definice 4: Pro „teorii měřidla mřížky“ definovanou na místní mřížce Hamiltonians existuje operátor podporovaný na každém místě mřížky, který dojíždí s Hamiltonianem. V některých případech odpovídá tento operátor fyzikálně měřitelné veličině.

Případy definic 3 a 4 jsou trochu koncepčně jemné, takže nebudu do nich zde – mohu je oslovit následovně -up otázka, pokud má někdo zájem.

Aktualizace: Napsal jsem následné odpovědi ohledně toho, zda existuje smysl, ve kterém lze měřitelné stupně volnosti fyzicky měřit v Hamiltonianově případě a Lagrangeovský případ .

Komentáře

  • Skvělá odpověď! Toto je jedno z nejlepších vysvětlení (na jednom místě), na které zatím narazíte !!!! : D
  • Ive položil doplňující otázku na jemnosti mezi # 3 a # 4
  • physics.stackexchange.com/q/ 267175/122066
  • @ user122066 V aktualizaci na konci mé odpovědi najdete odkazy na mé následné kroky.

Odpověď

Pochopil jsem to až po absolvování kurzu obecné relativity (GR), diferenciální geometrie a teorie kvantového pole (QFT). Podstatou je jen změna souřadnicových systémů, která se musí v derivaci promítnout. Vysvětlím, co tím myslím.

Máte teorii, která je invariantní pod nějakou skupinou symetrie. Takže v kvantové elektrodynamice máte Lagrangeovu hustotu pro fermiony (zatím žádné fotony) $$ \ mathcal L = \ bar \ psi (x) [\ mathrm i \ gamma ^ \ mu \ částečný_ \ mu – m] \ psi (x) \,. $$ Tento $ \ bar \ psi $ je jen $ \ psi ^ \ dagger \ gamma ^ 0 $, důležité je, že je komplexně konjugovaný.Skutečnost, že se jedná o čtyři vektory ve spinovém prostoru, zde není nijak znepokojující. Nyní je možné transformovat $ \ psi \ na \ exp (\ mathrm i \ alpha) \ psi $ s nějakým $ \ alpha \ in \ mathbb R $. Pak $ \ bar \ psi \ to \ bar \ psi \ exp (- \ mathrm i \ alpha) $ a Lagrangian budou invariantní, protože derivace nepůsobí na exponenciální funkci, je to jen fázový faktor. Zde máte globální symetrii.

Nyní povýšte symetrii na místní, proč ne? Místo globálního $ \ alpha $ má nyní jeden $ \ alpha (x) $. To znamená, že v každém bodě časoprostoru zvolíme jiný $ \ alpha $. Problém je v tom, že když se nyní transformujeme, jeden získá $ \ partial_ \ mu \ alpha (x) $ s řetězci a pravidly diferenciace produktu. To se zpočátku zdá jako technická komplikace.

Existuje více vypovídající způsob, jak to vidět:
Vezmete derivaci pole $ \ psi (x) $. To znamená převzít rozdílový kvocient jako $$ \ částečný_ \ mu \ psi (x) = \ lim _ {\ epsilon \ až 0} \ frac {\ psi (x + \ epsilon \ vec e_ \ mu) – \ psi (x) } {\ epsilon} \,. $$ S globální transformací to funguje dobře. Ale s místní transformací v zásadě odečtete dvě hodnoty, které jsou měřeny odlišně. V diferenciální geometrii máte to, že tečné prostory v různých bodech potrubí jsou různé, a proto nelze porovnávat vektory pouze podle jejich složek. K zajištění paralelního přenosu je potřeba připojení s koeficienty připojení . Podobné je to zde. Nyní jsme povýšili $ \ phi $ z bydlení na $ \ mathbb R ^ 4 $ na bydlení ve svazku $ \ mathbb R ^ 4 \ krát S ^ 1 $, protože máme skupinu měřidel U (1). Proto potřebujeme nějaké spojení, abychom přenesli transformovaný $ \ phi $ z $ x + \ epsilon \ vec e_ \ mu $ na $ x $. Zde je třeba zavést nějaké připojení, které je $$ \ partial_ \ mu \ to \ mathrm D_ \ mu: = \ partial_ \ mu + \ mathrm i A_ \ mu \,. $$

Pokud zapojíte to do Lagrangeovy hustoty, aby bylo $$ \ mathcal L = \ bar \ psi (x) [\ mathrm i \ gamma ^ \ mu \ mathrm D_ \ mu – m] \ psi (x) $$ a poté vyberte $ A_ \ mu = \ partial_ \ mu \ alpha $ uvidíte, že Lagrangeova hustota zůstane neměnná i při lokálních transformacích, protože koeficient připojení pouze odečte nežádoucí člen od pravidla produktu / řetězce.

Obecně platí, že relativitu máte symetrii pod libovolným difeomorfismem, cena spočívá v tom, že musíte změnit derivaci na připojení, $$ \ částečné \ na \ nabla: = \ částečné + \ Gamma + \ cdots \,. $$

Odpověď

Jelikož jste zmínili, že jste přišli z matematického prostředí, mohlo by vám připadat hezké přijmout odpověď ve smyslu tříd ekvivalence.

Teorie měřidla je fyzikální teorie, kde pozorovatelné veličiny, jako například věci, které byste mohli měřit pomocí experimentu s dokonalým měřicím zařízením, jsou třídami ekvivalence ve vektorovém prostoru.

Elektromagnitismus je nejběžnější příklad. Teorie moderní fyziky jsou vždy psány jako svazky vláken, kde základní potrubí je časoprostor a vlákna jsou nějaký tečný prostor spojený s každým bodem (nazývaným událost) v časoprostoru. E & M ve volném prostoru (bez poplatků) je popsán přidružením čtyřkomponentního objektu s názvem $ A _ {\ mu} $ ke každému časoprostorovému bodu $ x $ a vyžadující $ A _ {\ mu} (x) $ k uspokojení maxwellových rovnic.

Pozorovatelnými, stejně měřitelnými veličinami v přírodě jsou však elektrická a magnetická pole, $ \ vec {E} (x) $ a $ \ vec {B} (x) $. Ty jsou odvozeny od $ A _ {\ mu} (x) $ pomocí definice uvedené v této wiki (podívejte se na maticové prvky $ F _ {\ mu \ nu} (x) $).

Ukázalo se, že transformace $ A _ {\ mu} (x) \ rightarrow A _ {\ mu} (x) + \ částečné _ {\ mu} f (x) $ pro jakoukoli dvakrát diferencovatelnou funkci $ f (x) $ dává stejné hodnoty pozorovatelných polí $ \ vec {E} (x) $ a $ \ vec {B } (x) $. Existuje tedy vztah ekvivalence

$ A _ {\ mu} (x) \ přibližně A _ {\ mu} (x) + \ částečné _ {\ mu} f (x) $ .

Obecně platí, že teorie měřidel jsou teorie, kde pozorovatelné veličiny jsou funkcemi tříd ekvivalence některých vektorů ve vektorovém prostoru. v tomto případě byly naše vektory $ A _ {\ mu} (x) $ (jedná se o vektory ve funkčním prostoru dvakrát diferencovatelných funkcí v časoprostoru) a náš vztah ekvivalence byl uveden výše.

Pokud jde o vaše konečné otázka, zda věci, jako je celková energie systému, která se určuje pouze po konstantní faktor v jakémkoli referenčním rámci, činí z Newtonovské dynamiky teorii měřidla. Odpověď zní ne, opravdu ne. V zásadě, pokud nemluvíte o teorii pole, fyzik tuto věc nenazve teorií měřidla.

Komentáře

  • Pěkná odpověď, ale možná by bylo přesnější říci, že pozorovatelné v teorii měřidla jsou funkce na množině tříd ekvivalence [věci jako připojení a sekce svazků] mod měřidlo ekvivalence.Frustrace z teorie měřidel spočívá v tom, že nemůžeme znát mnoho případů, kdy můžeme popsat tyto funkce, kromě případů, kdy jim dáme funkce na spojích a úsecích.
  • Máte pravdu, můj jazyk je trochu nedbalý. Mělo by to číst něco jako “ pozorovatelné funkce ve třídách ekvivalence nějakého vektorového prostoru. “

Odpověď

Invariance měřidla je jednoduše nadbytečnost v popisu fyzického systému. Tj. můžeme si vybrat z nekonečného počtu vektorových potenciálů v E & M.

Například nekonečný počet vektorových potenciálů může popsat elektromagnetismus transformací níže

$$ A (x) \ až A_ \ mu (x) + \ částečné_ \ mu \ alpha (x) $$

Výběr konkrétního měřidla (upevnění měřidla) může vyřešit fyzický problém mnohem jednodušší, než by byl, pokud byste měřidlo neopravili.

Normálně se zvolí měřidlo Coulomb: $ \ nabla \ cdot A = 0 $.

Mělo by zdůrazněte, že invariance měřidla NENÍ symetrií přírody a nemůžete měřit nic, co s ní souvisí.

Invariance měřidel je nejužitečnější v teorii kvantového pole a je zásadní pro prokázání renormalizovatelnosti. Navíc prvky S-matice v QFT vyžadují lokální Lagrangeovu a tedy invariantnost měřidla.

Jako příklad toho, proč bychom zavedli vektorový potenciál $ A ^ \ mu $, zvažte Aharonov-Bohmův efekt, který vzniká díky globální topologické vlastnosti vektorového potenciálu. Existují ještě další důvody, proč invariance měřidel usnadňuje život, snižuje stupně volnosti fotonu v takzvaném kovariantu nebo měřidle $ R_ \ xi $, kauzalitě atd. Užitečnost měřicí invariance se nestane zcela evidentní, dokud se člověk nezačne snažit pracovat s kvantovou teorií pole. : D

Komentáře

  • @ user122066 Pro budoucí použití, pokud potřebujete vyhledat symbol, přejděte na tato otázka tex.SE . Ale v MathJaxu jsou podporovány pouze určité (La) TeX příkazy. Seznam najdete v dokumentaci MathJaxu .
  • Všechny reference MathJaxu zkontrolujte takto: Základní výukový program MathJax a rychlá reference
  • @ user122066: napsali jste: “ Nyní je to naprosto zásadní vlastnost moderní fyziky a bez toho bychom se mohli velmi dobře ztratit! “ Myslím, že to tady přeháníte a právě to dělá takovou frázi “ děsivé „. Neexistuje žádný důkaz, že musíme pracovat pouze s “ měřicími teoriemi „. Jiné přístupy jsou zatím neprozkoumané.
  • @VladimirKalitvianski dost fér. S maticí S existují rekurzivní vztahy, které se vyhýbají měřidlům, ale je velmi těžké si představit něco, co by bylo objeveno, což usnadňuje konputaci, než měřit invariantnost. Máte však naprostou pravdu. Tuto část smažu
  • (užitečné také pro vyhledávání symbolů TeXu – Detexify .)

Odpověď

Tyto výpočty velmi často závisí pouze na rozdílu mezi dvěma hodnotami, nikoli na konkrétních hodnotách samotných . Máte tedy možnost zvolit si nulu podle svých představ. Je to příklad invariance měřidla ve stejném smyslu jako výše uvedené příklady absolventa?

Ano, je to v nejobecnější definici invariance měřidla, to je to, čemu fyzici říkají invariance globálního měřidla . Více o tom níže.

Pokud bych na váš titul musel napsat odpověď jedinou větou, bylo by to toto:

Měřicí invariance je dobře definovaná fyzikální zákonitost pod mapou kvocientu, která kondenzuje konfigurační / parametrický prostor / souřadnice pro fyzický systém do sady tříd ekvivalence fyzicky ekvivalentních konfigurací.

To je ve stejném smyslu, že například produkt coset je dobře definován pod mapou, která kalkuluje pryč od normální podskupiny skupiny. Fyzika konfigurace je nezávislá na volbě člena třídy ekvivalence .

Ve svých nejmenších pojmech je invariance měřidla jednoduše tvrzením, že v matematickém popisu fyzického systému je redundance . Jinak řečeno, systém má symetrii , neměnnost vůči skupině transformací.

Globální symetrie měřidla je ta, kde je konfigurační prostor je jednoduchý kartézský součin ( tj. triviální svazek vláken) ze sady fyzicky odlišných tříd ekvivalence a nadbytečného parametru, jako je tomu u vašeho příkladu rozdílu mezi dvěma hodnotami. Pokud je fyzický popis lagrangeovým popisem, pak přichází do popředí Noetherova věta a identifikuje konzervované veličiny, jednu pro každý takový nadbytečný parametr.Skupina měřidel, tj. skupina symetrií, ovlivňuje všechny třídy ekvivalence (vlákna) stejně. Odečtení konstantního potenciálu od elektrostatického potenciálu je taková symetrie a obrovský pokrok pro Corvid Civilization, protože umožňuje vránám sedět na silnoproudých silách a šťastně střílet vánek společně, diskutovat o jejich nejnovějších myšlenkách o teoriích měřidel a deklarovat to Už nikdy víc!“ budeme se bát, že globální přidání 22 kV k elektrostatickému potenciálu může změnit fyziku systému, do kterého patříme.

Avšak obvykle, když fyzici hovoří o teorii měřidla, mají na mysli tu, kde může působit skupina symetrie obecnějším způsobem, kdy v každém bodě konfiguračního prostoru působí jiný člen skupiny. Odpovídající svazek vláken již není triviální. I když jste chtěli jednodušší příklad než elektrodynamika, nemyslím si, že existuje. Fází přidanou k funkci elektronových vln může být jakákoli plynulá funkce souřadnic a další výrazy, které vyplývají z Leibnizova pravidla, se vztahují na deriváty v pohybová rovnice vlnové funkce (Dirac, Schrödinger) je přesně absorbována do uzavřené části EM potenciálu jedné formy. Mimochodem, mimochodem, vždy rád vizualizuji EM potenciál ve Fourierově prostoru, což můžeme dělat s rozumnými omezeními ( např. postulát, že budeme uvažovat například jen o temperovaných distribucích) , protože prostorová část nadbytečné části čtyř potenciálu je pak jeho složkou podél vlnového vektoru ( tj. myšlenka jako 3-vektor) a fyzicky záleží pouze na složce normální vlnovému prvku: je to jediná část, která přežije $ A \ mapsto \ mathrm {d} A = F $.

Podle mého názoru byste si měli vzít z příkladu EM dvě věci:

  1. I když to prakticky vede k další složitosti, koncepčně je to jen malý skok od vašeho jednoduchého globálního rozměru symetrického příkladu; jednoduše necháme symetrie působit lokálně, místo aby působily na všechny body konfiguračního prostoru. stejně;

  2. Vezmeme-li v úvahu experimentálně skutečný elektromagnetismus, předpokládáme, že tato invariance měřidla m mohou být relevantní obecněji, a tak se díváme na jeho přítomnost i v jiných fyzikálních jevech. Není to nic jiného než čin motivovaný tuší. Experimentálně zjistíme, že je to plodná věc. Ve fyzice neexistuje hlubší vhled než experimentální výsledky.

Nakonec bych měl zmínit, že pojmy měřidla / svazku vláken jsou také užitečné, když uměle deklarujeme třídy ekvivalence konfigurací založené na potřebách našeho problému , i když mezi členy třídy ekvivalence existuje fyzický rozdíl. Jedním z nejkrásnějších příkladů tohoto způsobu myšlení je Montgomery „s “ Gauge Theory of the Falling Cat „. Studujeme ekvivalenční třídy konfigurace koček, které jsou ekvivalentní modulo správná euklidovská izometrie pro formulaci prostoru tvaru kočky , který se při standardním ošetření, kde je kočka považována za dvousekční robot s kulovým kloubem bez zkroucení, stává skutečné projektivní letadlo $ \ mathbb {RP} ^ 2 $. Celý konfigurační prostor je pak svazek vláken s tvarovým prostorem $ \ mathbb {RP} ^ 2 $ jako základnou a skupinou $ SO (3) $ definující orientaci jako vlákno . Kočka se může otáčet při zachování momentu hybnosti pomocí cyklických deformací svého vlastního tvaru kvůli zakřivení spojení, které vyplývá z představy o paralelním přenosu, což vyplývá z zachování momentu hybnosti.

Odpověď

Zde je nejzákladnější příklad symetrie měřidla, na který si myslím.


Předpokládejme, že chcete o diskutovat o mravencích chodících kolem Möbiovy kapely. Chcete-li popsat polohy mravenců, je vhodné si představit, že se pás rozřízne podél jeho šířky, takže se z něj stane obdélník. Potom mi můžete říct, kde se mravenec nachází, tím, že mi řeknete tři věci:

  • Její zeměpisná šířka – její poloha podél šířky obdélníku.
  • Její zeměpisná délka – její poloha po délce obdélníku.
  • Její orientace – ať už lpí na horní nebo spodní ploše obdélníku.

Význam zeměpisné délky závisí na umístění ten imaginární střih. Pokud posunete řez, změní se všechny délky „mravenců“. Nemůže existovat žádný fyzický důvod upřednostňovat jeden řez před druhým, protože můžete pás posunout po jeho délce, aniž byste změnili jeho tvar nebo ovlivnili chování mravenců. slova, nemůže existovat žádný fyzicky smysluplný pojem absolutní délky, protože pásmo má překladovou symetrii .

Podobně význam orientace závisí na tom, jak označujete povrchy obdélníku jako horní a dolní.Nemůže existovat žádný fyzický důvod upřednostňovat jedno značení před druhým, protože můžete vyměnit dva povrchy pásu, aniž byste změnili jeho tvar nebo ovlivnili chování mravenců. Tato výměna je příkladem symetrie měřidla . Má několik pozoruhodných rysů, které obyčejné symetrie nesdílejí. Podívejme se na jednu z nich.


Pro každou symetrii situace existuje určitý aspekt situace které lze popsat několika způsoby, bez fyzických důvodů pro volbu mezi nimi. Někdy je však užitečné provést výběr a držet se ho, i když je výběr fyzicky bezvýznamný. Například v diskusích o lidech plavících se po povrchu Země téměř každý, koho znám, definuje zeměpisnou délku pomocí řezu, který prochází Greenwichem v Londýně, hlavně proto, že někteří lidé který tam žil, převzal kontrolu nad světem a vytiskl mnoho námořních map.

Pokud bychom sledovali mravence na obyčejném válcovém pásu, mohli bychom se usadit na představě o orientaci stejně snadno. „Malovali jsme jednu stranu tyrkysové kapely na„ horní “a druhou stranu na modrou na„ spodní “, a to by bylo ono. Na Möbiově kapele jsou věci komplikovanější, protože Möbiova kapela má pouze jednu stranu! pokusíte se namalovat jeden povrch tyrkysově a protilehlý povrch modře, počínaje v malé oblasti pásu a pohybující se směrem ven, tyrkysové a modré oblasti se nevyhnutelně srazí. (V naší dřívější diskusi byla srážka skrytá podél podélného řezu.)

V situaci s běžnou symetrií, jako je překladová symetrie, si nemůžete vybrat mezi možnými popisy tak, aby to bylo fyzicky smysluplné. V situaci se symetrií měřidla možná ani nebudete schopen si vybrat mezi možnými popisy způsobem, který je globálně konzistentní! Vždy si však můžete zvolit konzistentní popisy v malých oblastech vesmíru. Proto se symetrie měřidel často nazývají místní symetrie .


Po pokusu o dlouhý a základní popis toho, co je symetrie měřidel, bych také rád nabídl krátký, sofistikovaný. V našich nejjednodušších fyzických modelech se události odehrávají na plynulém potrubí zvaném prostor nebo časoprostor . Obyčejná symetrie je difeomorfismus časoprostoru, který zachovává fyzickou možnost událostí. Ve složitějších modelech se události odehrávají na svazku vláken v časoprostoru. Symetrie měřidla je automorfismus svazku vláken, který zachovává fyzickou možnost událostí.

V našem elementárním příkladu hraje roli prostoru Möbiova skupina a mravenci procházejí v pásmu orientační svazek. Orientační svazek má automorfismus, který si vyměňuje dva povrchy pásma.

V klasickém elektromagnetismu hraje roli časoprostoru Minkowskiho časoprostor nebo nějaký jiný Lorentzianův potrubí a elektromagnetické pole je reprezentováno spojení na svazku kruhů v časoprostoru. Na Kaluza-Kleinově obrázku se nabité částice pohybují ve svazku kruhů a létají v přímkách, jejichž „stíny“ v časoprostoru jsou to spirálovité cesty, které vidíme. Kruhový svazek má rodinu automatorfismů, které rotují kruhová vlákna, což fantastickí lidé nazývají symetrií měřidla $ \ operatorname {U} (1) $. Tento obrázek zobecňuje na všechny klasické teorie Yang-Mills.

V Palatiniho obrázek obecné relativity, hladký rozdělovač $ 4 $ hraje roli časoprostoru a gravitační pole je reprezentováno $ \ operatorname {SO} (3,1) $ připojení na svazku rámu rozdělovače. Mám podezření, že měřicí symetrie linearizované gravitace, které jste zmínil, jsou automorfismy svazku rámců.

V Einsteinově obrázku obecné relativity jsou symetrie diffeomorfismy časoprostoru. Klasifikuji je jako běžné symetrie, spíše než měřicí symetrie. Jak tparker zmínil , pojem „měřicí symetrie“ však ne všichni používají stejným způsobem.

Komentáře

  • Báječné! Myšlenka M ö bius band je prostě krásná a opravdu zachycuje podstatu mnohem složitějších myšlenek. Také se mi na tom líbí, jak tok myšlenek ukazuje, jak jednoduché plynulé zobecnění.
  • Hej, co ‚ s těmi třemi hlasy? id = „d63e19a0a6“>

s lurkers na tomto webu špatně, je to zatím nejlepší odpověď na tuto otázku vzhledem k požadavkům OP ‚ s. jeden z hlasů je můj.

  • @WetS avannaAnimalakaRodVance, nedělal bych si ‚ starosti s počtem hlasů. Setkáte-li se s někým, komu by tato odpověď mohla prospět, stačí ho přímo propojit.Jako reference funguje stejně dobře v dolní části seznamu odpovědí seřazených podle hlasování i v horní části.
  • Odpověď

    V případě symetrie $ U (1) $ existuje velmi zajímavá fyzikální interpretace invariance měřidla. Symetrie měřidla je jediný způsob, jak získat Lorentzovu invariantní interakci hmoty (v širokém smyslu – pole libovolného otáčení) a fotonů (jsou to nehmotné částice s helicitou 1), která klesá s $ \ frac {1} {r ^ { 2}} $ na velké vzdálenosti (toto tvrzení není nic jiného než Coulombův zákon). Stručně řečeno, 4-potenciál $ A _ {\ mu} $, který poskytuje zákon o inverzních čtvercích EM interakcí, není Lorentzův kovariant a projev Lorentzovy invariance interakce vede k účtování místní ochrany.

    Opravdu, z velmi obecných úvah na základě symetrie našeho časoprostoru lze ukázat, že fotony jsou prezentovány antisymetrickým 4-tenzorem $ F _ {\ mu \ nu} $, který se nazývá EM . Je to Lorentzův kovariant formálně (pomocí naivních manipulací s tenzorovými indexy) a konstrukcí (jako pole, které představuje částice s helicitou 1), tj. pod Lorentzova transformace daná maticí $ \ Lambda _ {\ mu} ^ {\ \ nu} $ je transformována jako $$ F _ {\ mu \ nu} \ na \ Lambda _ {\ mu} ^ {\ \ alfa} \ Lambda _ {\ nu} ^ {\ \ beta} F _ {\ alpha \ beta} $$ Dále předpokládejme, že máme hmotná pole $ \ psi $ a diskutujeme o interakci hmoty s fotony. Nejviditelnějším způsobem, jak tuto interakci získat, je získat ji konstrukce všech možných závin $ F _ {\ mu \ nu} $ s hmotnými poli a Lorent-kovariantními objekty (matice Dirac, připojení Levi-Civita atd.). Předpokládejme také, že z experimentu víme, že interakce klesá na velké vzdálenosti jako $ \ frac {1} {r ^ {2}} $. To bohužel není možné, pokud použijeme $ F _ {\ mu \ nu} $. Formálním důvodem je, že propagátor tohoto pole, který ukazuje zákon interakce, klesá rychleji než $ \ frac {1} {r ^ {2}} $. Je to proto, že dva indexy a antisymetrie $ F _ {\ mu \ nu} $.

    Můžeme udělat nějakou nápovědu a zavést objekt $ A _ {\ mu} $ s jednou indicí, zvanou 4-potential : $$ F _ {\ mu \ nu} = \ částečné _ {\ mu} A _ {\ nu} – \ částečné _ {\ nu} A _ {\ mu} $$ Interakce jsou nyní konstruovány konvolucemi $ A_ { \ mu} $ s hmotnými poli a dalšími kovariantními objekty.

    Samozřejmě požadujeme, aby $ A _ {\ mu} $ představovaly bezhmotnou helicitu 1 částice stejně jako $ F _ {\ mu \ nu} $. Tento požadavek bohužel vede k tvrzení, že 4-potenciál není Lorentzův kovariant (i když formálně to samozřejmě je). Přesně pod Lorentz transformační pole $ A _ {\ mu} $, o kterém se předpokládá, že představuje bezhmotné částice helicity 1, se změní jako $$ \ tag 1 A _ {\ mu} \ na \ Lambda _ {\ mu} ^ {\ \ nu} A _ {\ nu} + \ částečný _ {\ mu} \ varphi $$ Vidíme, že to není Lorentzův kovariant. Volný jazyk pro $ A _ {\ mu} $, což je jen $$ L = – \ frac { 1} {4} F _ {\ mu \ nu} F ^ {\ mu \ nu}, $$ je Lorentzův invariant.

    Existuje však jeden způsob, jak zachovat Lorentzovu invariantu interakcí. Tímto způsobem je zkonstruujte je tak, aby při transformaci byly invariantní $ A _ {\ mu} \ na A _ {\ mu} + \ částečné _ {\ mu} \ varphi $. Přesně tak, amplituda interakce $ M _ {\ mu_ {1} … \ mu_ {n}} (p_ {i}, \ epsilon_ {j} (k_ {j})) $, kde $ \ epsilon $ jsou vektory fotonové helicity (polarizace), $ p_ {i} $ jsou momenty interakce částice a $ k_ {j} $ je hybnost fotonů), musí b e invariant při transformaci $$ \ tag 2 \ epsilon _ {\ mu} (p) \ to \ epsilon _ {\ mu} (p) + \ alpha p _ {\ mu} $$ Ve formálním jazyce, jak to může ukázat zpracování procesů s emisemi měkkých fotonů (fotonů s téměř nulovým momentem), to znamená, že musí existovat zákon zachování svazků hmoty $ g_ {i} $: $$ g_ {1} + g_ {2} + … = \ text {const} $$ To není nic jiného než zákon zachování poplatků. Spolu s $ (2) $ to není nic jiného než symetrie měřidla $ U (1) $.

    Takže vidíme, že Lorentzova invariance interakcí fotonů s hmotou zákonem obráceného čtverce vede k měřicí invarianti. Analogicky lze argumentovat principem ekvivalence pro případ interakce gravitonů se všemi poli.

    Odpověď

    Teorie měřidla popisují konektivitu prostor s malými symetrickými extra rozměry

    Začněte nekonečným válcem (přímým součinem přímky a malého kruhu). Válec lze otočit. Abychom se vyhnuli apelování na koncepty, které se snažím vysvětlit, řeknu jen, že válec je vyroben z drátěného pletiva: rovnoměrně rozmístěné kruhy připájené k drátům, které vedou po jeho délce. Dlouhé dráty se mohou otáčet jako celek a mezi každou dvojicí sousedních kruhů se vytváří úhlové kroucení. Je jasné, že jakákoli taková konfigurace může být nepřetržitě deformována na jakoukoli jinou: všechny takové válce jsou ekvivalentní z hlediska toho, jak se na ně příslovečný mravenec plazí.

    Řádek nahraďte uzavřenou smyčkou, aby byl produkt torus (a přemýšlejte o torusu jako o koblihu ze sítě, i když taková rovina malých kruhů technicky narušuje analogii). Jakákoli část koblihy, krátká z celé věci, může být deformována na stejnou část jakéhokoli jiného koblihu, ale koblihy jako celek někdy nemohou být, protože síťový kroucení kolem koblihy nelze změnit. Třídy ekvivalentních koblih jsou zcela charakterizovány tímto síťovým twistem, který je ze své podstaty nelokální.

    Nahraďte smyčku (ne malý kruh) rozdělovačem dvou nebo více dimenzí. Je pravda, i když to není zřejmé, že fyzická část spojení je zcela dána integrovaným kroucením kolem všech uzavřených smyček ( Wilsonových smyček ).

    $ A $ a $ F $ kvantifikují konektivitu

    V diskrétním případě lze spojení popsat nejjednodušší pomocí zkroucení mezi sousedními kruhy. V limitu kontinua se to stane „twist gradient“ v každém kruhu. Jedná se o $ A_ \ mu $, takzvaný vektorový potenciál.

    Jakoukoli spojitou deformaci lze popsat pomocí skalárního pole $ \ phi $ představujícího částku, kterou každý kruh je zkroucený (relativně k tomu, kde byl dříve). Tím se změní $ A_ \ mu $ o gradient $ \ phi $, ale nezmění se žádná fyzická veličina (integrál smyčky).

    Popis v pojmy Wilsonových smyček, $ \ mast_ \ gamma A \ cdot \, \ mathrm dx $, jsou elegantnější, protože obsahují pouze fyzicky smysluplné veličiny, ale jsou nelokální a vysoce redundantní. Pokud je prostor jednoduše propojen, můžete se vyhnout r edundancy a nonlocality zadáním kroucení pouze kolem diferenciálních smyček, protože z nich lze vytvořit větší smyčky. Takzvaný tenzor pole, $ \ partial_ \ nu A_ \ mu – \ partial_ \ mu A_ \ nu = F _ {\ mu \ nu} $, vám dává přesně to.

    (Pokud je prostor nejen jednoduše připojené, stále vám může uniknout diferenciální smyčka plus jeden obrat sítě pro každý prvek generující sady základní skupiny . Torus byl samozřejmě jednoduchý příklad toho.)

    Síla pochází z Aharonov – Bohmova efektu

    Zvažte skalární pole definované v celém prostoru (na rozdíl od dřívějších polí má toto hodnotu v každém bodě každé kružnice). Pole je všude nula s výjimkou dvou úzkých paprsků, které se rozcházejí z bodu a znovu se sbíhají někde jinde. (Možná se odrážejí zrcadly; možná je prostor pozitivně zakřivený; na tom nezáleží.)

    Pokud nebude pole konstantní napříč kruhy, bude interferenční chování paprsků záviset na rozdílu v kroucení podél obou cest. Tento rozdíl je jen integrál kolem uzavřené smyčky tvořené cestami.

    Toto je (zobecněný) Aharonov – Bohmův efekt. Pokud jej omezíte na odlišně odlišné cesty a použijete $ F _ {\ mu \ nu} $ k výpočtu vlivu na rušení, získáte zákon o elektromagnetické síle.

    Pole můžete rozložit na Fourierovy komponenty. Fourierovo spektrum je v malé dimenzi diskrétní. Nultá (konstantní) harmonická není zkroucením ovlivněna. Druhá harmonická je ovlivněna dvakrát tolik jako první. Jedná se o elektrické náboje.

    Ve skutečnosti se z neznámých důvodů zdá, že existují pouze určité mimodimenzionální harmonické. Pokud existuje pouze první harmonická, existuje ekvivalentní popis pole jako jediné komplexní amplitudové + fáze v každém bodě velkých rozměrů. Fáze je relativní k libovolnému lokálnímu nulovému bodu, který je také využíván vektorovým potenciálem. Když porovnáte fázi s fází v blízkém bodě a existuje mezi nimi vektorově potenciální zkroucení $ \ mathrm d \ theta $, musíte upravit hodnotu pole o $ i \, \ mathrm d \ theta $ . Toto je původ kovariančního derivátu měřidla .

    Kruhy zobecňují na jiné tvary

    Pokud nahradíte kruhy se 2 koulemi, získáte teorii měřidla $ \ mathrm {SU} (2) $. Je číselně hnusnější: skupina symetrie je nekomutativní, takže musíte přinést mechanismus Lieovy algebry. Geometricky však nic hodně se změnilo. Připojení je stále popsáno síťovým kroucením kolem smyček.

    Jedním nešťastným rozdílem je, že popis náboje jako mimodimenzionální harmonie cs už docela nefunguje. Sférické harmonické vám dávají pouze celočíselné reprezentace rotace a všechny známé částice jsou v reprezentacích spin-0 nebo spin-½ standardního modelu $ \ mathrm {SU} (2) $, takže částice ovlivněné $ \ mathrm {SU} (2) $ force vůbec nelze takto popsat. Může existovat způsob, jak tento problém vyřešit s exotičtějším typem pole.

    Nemám nic zasvěceného říci o části $ \ mathrm {SU} (3) $ skupiny měřidel Standard Model, kromě toho, že poukazuji na to, že celá skupina měřidel SM může být vložena do $ \ mathrm {Spin} (10) $ a myslím, že je snazší vizualizovat 9 koulí než tvar pomocí $ \ mathrm {SU} (3) $ symetrie.

    Obecná relativita je podobná.

    Obecná relativita je Riemannova křivka tenzoru analogická s tenzorem pole; představuje úhlovou rotaci vektoru transportovaného kolem diferenciální smyčky. Aharonov-Bohmův jev je obdobou úhlového deficitu kolem kosmického řetězce . teorie Kaluza-Klein původně odkazoval na konkrétní způsob, jak získat elektromagnetismus z obecné relativity v pěti dimenzích; nyní často odkazuje na širokou myšlenku, že síly měřidla standardního modelu a obecná relativita budou pravděpodobně různými aspekty stejné věci.

    Odpověď

    V Classical Electrodynamics (CED) znamená invariance měřidla nezávislost elektrických a magnetických polí na konkrétní „volbě“ potenciálů $ \ varphi $ a $ \ bf {A} $. Rovnice pro potenciály samozřejmě závisí na konkrétní volbě „měřidla“ a poskytují různá řešení pro různé měřidla.

    V QM a QED znamená invariance měřidla také „invariantnost“ forma rovnic (řešení jsou stále různá, ale fyzicky ekvivalentní).

    Je ale třeba zachovat mějte na paměti, že jakákoli užitečná změna proměnné je také přijatelná, pokud odpovídající výsledky zůstanou fyzicky stejné. Forma rovnic by proto neměla být vůbec povinná „neměnná“.

    Napsat komentář

    Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *