Soy un estudiante de matemáticas con un pasatiempo interesado en la física. Esto significa que he tomado cursos de posgrado en dinámica cuántica y relatividad general sin la mayor parte de los cursos de física y el gran volumen de educación en las herramientas físicas y la mentalidad que los otros estudiantes que tomaron el curso tenían, como el teorema de Noether, lagrangiano. y mecánica hamiltoniana, métodos estadísticos, etc.

Los cursos en sí salieron bastante bien. Mi experiencia matemática compensó más o menos una falta de comprensión física. Sin embargo, todavía no he encontrado una explicación elemental de la invariancia de gauge (si existe tal cosa). Conozco algunos ejemplos, como que el potencial magnético es único solo hasta un (tiempo -) gradiente constante. También lo encontré en la relatividad general linealizada, donde hay varias perturbaciones diferentes en la métrica del espacio-tiempo que dan la misma dinámica observable.

Sin embargo, para entender realmente lo que está pasando, Me gusta tener ejemplos más simples. Desafortunadamente, no he podido encontrar ninguna. Supongo que, dado que «invariancia de calibre» es una frase tan aterradora, nadie usa esa palabra cuando escribe a un estudiante de secundaria.

Entonces, mi ( muy simple) la pregunta es: en muchos cálculos de física de la escuela secundaria, mides o calculas el tiempo, la distancia, la energía potencial, la temperatura y otras cantidades. Estos cálculos a menudo dependen solo de la diferencia entre dos valores, no los valores concretos en sí. Por lo tanto, puede elegir un cero a su gusto. ¿Es este un ejemplo de invariancia de calibre en el mismo sentido que los ejemplos de graduados anteriores? ¿O son estos dos conceptos diferentes?

Comentarios

  • Si le gusta esta pregunta, también puede disfrutar leyendo esta publicación de Phys.SE.
  • John Baez escribe : » El principio de calibre dice, en términos simples, que solo se puede decir si dos partículas están en el mismo estado si los mueve uno al lado del otro para poder compararlos. Resolver las consecuencias matemáticas de este principio conduce a teorías de calibre que explican las fuerzas que vemos en la naturaleza. »

Respuesta

La razón por la que es tan difícil entender a qué se refieren los físicos cuando hablan de «medir la libertad» es que hay al menos cuatro definiciones no equivalentes que he visto utilizadas :

  • Definición 1: Una teoría matemática tiene una libertad de calibre si algunos de los grados de libertad matemáticos son «redundantes» en el sentido de que dos expresiones matemáticas diferentes describen exactamente el mismo sistema físico. . Entonces, los grados de libertad redundantes (o «dependientes del calibre») son «no físicos» en el sentido de que ningún experimento posible podría determinar de manera única sus valores, ni siquiera en principio. Un ejemplo famoso es la fase general de un estado cuántico: es completamente inconmensurable y dos vectores en el espacio de Hilbert que difieren solo en una fase general describen exactamente el mismo estado. Otro ejemplo, como mencionaste, es cualquier tipo de potencial que debe diferenciarse para producir una cantidad física, por ejemplo, una función de energía potencial (aunque algunos de sus otros ejemplos, como la temperatura, no son ejemplos de cantidades dependientes del calibre, porque hay un sentido físico bien definido de temperatura cero).

    Para sistemas físicos que se describen mediante estructuras matemáticas con una libertad de calibre, la mejor manera de definir matemáticamente una configuración física específica es como una clase de equivalencia de funciones dependientes de calibre que difieren solo en sus grados de libertad de calibre Por ejemplo, en la mecánica cuántica, un estado físico no es realmente descrito por un solo vector en el espacio de Hilbert, sino más bien por una clase de equivalencia de vectores que se diferencian por un múl escalar general. tiple. O más simplemente, por una línea de vectores en el espacio de Hilbert. (Si quiere ser elegante, el espacio de estados físicos se llama «espacio proyectivo de Hilbert», que es el conjunto de líneas en el espacio de Hilbert, o más precisamente una versión del espacio de Hilbert en el que los vectores se identifican si son proporcionales entre sí.) Supongo que también podría definir «energías potenciales físicas» como conjuntos de funciones de energía potencial que se diferencian solo por una constante aditiva, aunque en la práctica eso es una especie de exageración. Estas clases de equivalencia eliminan la libertad de calibre por construcción, y también son «invariantes de calibre».

    A veces (aunque no siempre) hay una operación matemática simple que elimina todos los grados de libertad redundantes mientras conserva todos los físicos. Por ejemplo, dada una energía potencial, se puede tomar el gradiente para producir un campo de fuerza, que se puede medir directamente.Y en el caso de E & M clásico, hay ciertas combinaciones lineales de derivadas parciales que reducen los potenciales a $ {\ bf E} $ y $ {\ bf B} directamente medibles. $ campos sin perder ninguna información física. Sin embargo, en el caso de un vector en un espacio cuántico de Hilbert, no existe una operación derivada simple que elimine la libertad de fase sin perder nada más.

  • Definición 2: Lo mismo como la Definición 1, pero con el requisito adicional de que los grados de libertad redundantes sean locales . Lo que esto significa es que existe algún tipo de operación matemática que depende de una operación arbitraria suave función $ \ lambda (x) $ en el espacio-tiempo que deja los grados físicos de libertad (es decir, las cantidades medibles físicamente) invariantes. El ejemplo canónico, por supuesto, es que si toma cualquier función suave $ \ lambda ( x) $, luego agregando $ \ parcial_ \ mu \ lambda (x) $ a los cuatro potenciales electromagnéticos $ A_ \ mu (x) $ deja las cantidades físicas ($ {\ bf E} $ y $ {\ bf B } $ campos) sin cambios. (En la teoría de campos, el requisito de que los «grados físicos de libertad» no se modifiquen se expresa en el sentido de que requiere que la densidad lagrangiana $ \ mathcal {L} [\ varphi (x)] $ no cambie , pero otras formulaciones son posibles.) Esta definición es claramente mucho más estricta – los ejemplos dados arriba en la Definición 1 no cuentan bajo esta definición – y la mayoría de las veces cuando los físicos hablan de «libertad de calibre» esta es la definición que quieren decir. En este caso, en lugar de tener solo unos pocos grados de libertad redundantes / no físicos (como la constante general para su energía potencial), tiene un número continuamente infinito. (Para hacer las cosas aún más confusas, algunas personas usan la frase «simetría de calibre global» en el sentido de la Definición 1 para describir cosas como la libertad de fase global de un estado cuántico, lo que claramente sería una contradicción en términos en el sentido de Definición 2.)

    Resulta que para lidiar con esto en la teoría cuántica de campos, necesitas cambiar sustancialmente tu enfoque de cuantificación (técnicamente, necesitas «calibrar y corregir la integral de tu ruta») para para eliminar todos los grados de libertad no físicos. Cuando la gente habla de cantidades «invariantes de calibre» bajo esta definición, en la práctica por lo general se refieren a las derivadas directamente medibles físicamente, como el tensor electromagnético $ F _ {\ mu \ nu} $, que permanecen sin cambios («invariantes») bajo cualquier transformación de calibre . Pero técnicamente, también hay otras cantidades invariantes de calibre, p. Ej. una superposición cuántica uniforme de $ A_ \ mu (x) + \ partial_ \ mu \ lambda (x) $ sobre todos los $ \ lambda (x) $ posibles para un $ A_ \ mu (x) en particular. $

    Consulte la publicación de blog de Terry Tao para obtener una gran explicación de este segundo sentido de simetría de calibre desde una perspectiva más matemática.

  • Definición 3: A veces se dice que un lagrangiano posee una «simetría de calibre» si existe alguna operación que depende de una función continua arbitraria en el espacio-tiempo que lo deja invariante, incluso si se cambian los grados de libertad son medibles físicamente.

  • Definición 4: Para una «teoría de calibre de celosía» definida en hamiltonianos de celosía local, existe un operador admitido en cada sitio de celosía que se desplaza con el hamiltoniano. En algunos casos, este operador corresponde a una cantidad medible físicamente.

Los casos de las Definiciones 3 y 4 son un poco sutiles conceptualmente, así que no voy a ir en ellos aquí – puedo abordarlos en un seguimiento -Pregunta si alguien está interesado.

Actualización: He escrito respuestas de seguimiento con respecto a si existe algún sentido en el que los grados de libertad del indicador se puedan medir físicamente en el caso hamiltoniano y el caso lagrangiano .

Comentarios

  • ¡Excelente respuesta! Esta es una de las mejores explicaciones (en un solo lugar) que he encontrado hasta ahora. : D
  • He hecho la pregunta de seguimiento sobre las sutilezas entre el # 3 y el # 4
  • physics.stackexchange.com/q/ 267175/122066
  • @ user122066 Vea la actualización al final de mi respuesta para obtener enlaces a mis seguimientos.

Respuesta

Solo entendí esto después de tomar una clase de relatividad general (GR), geometría diferencial y teoría cuántica de campos (QFT). La esencia es solo un cambio de sistemas de coordenadas que debe reflejarse en la derivada. Explicaré lo que quiero decir.

Tienes una teoría que es invariante bajo algún grupo de simetría. Entonces, en electrodinámica cuántica tienes una densidad lagrangiana para los fermiones (todavía no hay fotones) $$ \ mathcal L = \ bar \ psi (x) [\ mathrm i \ gamma ^ \ mu \ parcial_ \ mu – m] \ psi (x) \,. $$ Este $ \ bar \ psi $ es solo $ \ psi ^ \ dagger \ gamma ^ 0 $, lo importante es que es complejo conjugado.El hecho de que sea un cuatro vector en el espacio de espín no es de interés aquí. Lo que se puede hacer ahora es transformar $ \ psi \ en \ exp (\ mathrm i \ alpha) \ psi $ con algo de $ \ alpha \ in \ mathbb R $. Entonces $ \ bar \ psi \ to \ bar \ psi \ exp (- \ mathrm i \ alpha) $ y el Lagrangiano será invariante ya que la derivada no actúa sobre la función exponencial, es solo un factor de fase. Ahí tienes una simetría global.

Ahora promueve la simetría a una local, ¿por qué no? En lugar de un $ \ alpha $ global uno ahora tiene $ \ alpha (x) $. Esto significa que elegimos un $ \ alpha $ diferente en cada punto del espacio-tiempo. El problema es que cuando transformamos ahora, uno toma el $ \ parcial_ \ mu \ alpha (x) $ con las reglas de diferenciación de cadena y producto. Al principio, eso parece una complicación técnica.

Hay una forma más reveladora de ver esto:
Toma una derivación de un campo $ \ psi (x) $. Esto significa tomar un cociente de diferencias como $$ \ partial_ \ mu \ psi (x) = \ lim _ {\ epsilon \ a 0} \ frac {\ psi (x + \ epsilon \ vec e_ \ mu) – \ psi (x) } {\ epsilon} \,. $$ Esto funciona bien con una transformación global. Pero con la transformación local, básicamente resta dos valores que están medidos de manera diferente. En geometría diferencial se tiene que los espacios tangentes en los diferentes puntos de la variedad son diferentes y, por lo tanto, no se pueden comparar los vectores por sus componentes. Se necesita una conexión con coeficientes de conexión para proporcionar transporte paralelo . Aquí es similar. Ahora hemos promovido $ \ phi $ de vivir en $ \ mathbb R ^ 4 $ a vivir en el paquete $ \ mathbb R ^ 4 \ times S ^ 1 $ ya que tenemos un grupo de indicadores U (1). Por lo tanto, necesitamos algún tipo de conexión para transportar el $ \ phi $ transformado desde $ x + \ epsilon \ vec e_ \ mu $ a $ x $. Aquí es donde uno tiene que introducir alguna conexión que es $$ \ partial_ \ mu \ to \ mathrm D_ \ mu: = \ partial_ \ mu + \ mathrm i A_ \ mu \,. $$

Si lo conecta a la densidad de Lagrange para que sea $$ \ mathcal L = \ bar \ psi (x) [\ mathrm i \ gamma ^ \ mu \ mathrm D_ \ mu – m] \ psi (x) $$ y luego elija $ A_ \ mu = \ partial_ \ mu \ alpha $ verá que la densidad lagrangiana permanece invariante incluso bajo transformaciones locales, ya que el coeficiente de conexión solo restará el término no deseado de la regla del producto / cadena.

En la relatividad general tienes la simetría bajo difeomorfismo arbitrario, el precio es que tienes que cambiar la derivada a una conexión, $$ \ parcial \ a \ nabla: = \ parcial + \ Gamma + \ cdots \,. $$

Respuesta

Ya que mencionaste que tienes experiencia en matemáticas, puede que te resulte agradable dar una respuesta en términos de clases de equivalencia.

Una teoría de gauge es una teoría física donde las cantidades observables, como las cosas que se pueden medir con un experimento con un equipo de medición perfecto, son clases de equivalencia en un espacio vectorial.

El electromagnitismo es el ejemplo más común. Las teorías de la física moderna siempre se escriben como haces de fibras donde la variedad subyacente es el espacio-tiempo y las fibras son un espacio tangente asociado con cada punto (llamado evento) en el espacio-tiempo. E & M en el espacio libre (sin cargos presentes) se describe asociando un objeto de 4 componentes llamado $ A _ {\ mu} $ a cada punto del espacio-tiempo, $ x $, y requiriendo $ A _ {\ mu} (x) $ para satisfacer las ecuaciones de maxwell.

Sin embargo, las cantidades observables, igualmente medibles, en la naturaleza son los campos eléctrico y magnético, $ \ vec {E} (x) $ y $ \ vec {B} (x) $. Estos se derivan de $ A _ {\ mu} (x) $ usando la definición dada en esta wiki (mira los elementos de la matriz de $ F _ {\ mu \ nu} (x) $).

Resulta que la transformación $ A _ {\ mu} (x) \ rightarrow A _ {\ mu} (x) + \ partial _ {\ mu} f (x) $ para cualquier función dos veces diferenciable $ f (x) $ da los mismos valores de los campos observables $ \ vec {E} (x) $ y $ \ vec {B } (x) $. Entonces hay una relación de equivalencia

$ A _ {\ mu} (x) \ approx A _ {\ mu} (x) + \ partial _ {\ mu} f (x) $ .

Y en general, las teorías de gauge son teorías donde las cantidades observables son funciones en clases de equivalencia de algunos vectores en un espacio vectorial. En este caso, nuestros vectores eran $ A _ {\ mu} (x) $ (estos son vectores en el espacio funcional de funciones dos veces diferenciables en el espacio-tiempo), y nuestra relación de equivalencia se dio arriba.

En cuanto a su La cuestión de si cosas como la energía total del sistema que se determina solo hasta un factor constante en cualquier sistema de referencia hace que la dinámica newtoniana sea una teoría de gauge. La respuesta es no, en realidad no. Básicamente, si no está hablando de una teoría de campo, un físico no llamará a la cosa una teoría de calibre.

Comentarios

  • Buena respuesta, pero quizás sería más preciso decir que los observables en una teoría de gauge son funciones en un conjunto de clases de equivalencia de [cosas como conexiones y secciones de paquetes] equivalencia de calibre mod.La frustración de la teoría del calibre es que no podemos ‘ no conocer muchos casos en los que podamos describir estas funciones excepto dando funciones en las conexiones y secciones.
  • Tienes razón, mi lenguaje es un poco descuidado. Debería leer algo como » los observables son funciones en las clases de equivalencia de algún espacio vectorial. »

Respuesta

La invariancia de calibre es simplemente una redundancia en la descripción de un sistema físico. Es decir. podemos elegir entre un número infinito de potenciales vectoriales en E & M.

Por ejemplo, un número infinito de potenciales vectoriales puede describir el electromagnetismo mediante la siguiente transformación

$$ A (x) \ to A_ \ mu (x) + \ partial_ \ mu \ alpha (x) $$

La elección de un indicador específico (fijación de indicador) puede hacer que la solución un problema físico mucho más fácil de lo que sería si no arreglara un medidor.

Normalmente uno elige el medidor de Coulomb: $ \ nabla \ cdot A = 0 $.

Debería Cabe destacar que la invariancia de calibre NO es una simetría de la naturaleza y no se puede medir nada asociado con ella.

La invariancia de calibre es más útil en la teoría cuántica de campos y es crucial para demostrar la renormalizabilidad. Además, los elementos de la matriz S en QFT requieren un Lagrangiano local y, por lo tanto, una invarianza de calibre.

Como ejemplo de por qué introduciríamos el potencial vectorial $ A ^ \ mu $, considere el efecto Aharonov-Bohm que surge debido a propiedades topológicas globales del potencial vectorial. Hay otras razones por las que la invariancia de calibre facilita la vida, reduciendo los grados de libertad del fotón en la denominada covariante o $ R_ \ xi $ calibre, causalidad, etc. trabajar a través de la teoría cuántica de campos. : D

Comentarios

  • @ user122066 Para referencia futura, si necesita buscar un símbolo, consulte esta pregunta tex.SE . Pero solo ciertos comandos (La) TeX son compatibles con MathJax. Consulte la documentación de MathJax para obtener una lista.
  • Para obtener todas las referencias de MathJax, consulte esto: Tutorial básico y referencia rápida de MathJax
  • @ user122066: escribiste: » Ahora es una propiedad absolutamente crucial de la física moderna y ¡Es muy posible que estemos perdidos sin él! » Creo que exageras aquí y esto es lo que hace que esa frase sea » aterrador «. No hay pruebas de que solo debamos trabajar con » teorías de calibre «. Otros enfoques están simplemente inexplorados.
  • @VladimirKalitvianski es bastante justo. Hay relaciones de recursividad relacionadas con la matriz S que evita los calibres, pero es ‘ muy difícil imaginar que se descubra algo que haga la computación más fácil que la invariancia de calibre. Sin embargo, tienes toda la razón. Eliminaré esta parte
  • (También es útil para buscar símbolos TeX – Detexify ).

Respuesta

Estos cálculos a menudo dependen solo de la diferencia entre dos valores, no de los valores concretos en sí . Por lo tanto, puede elegir un cero a su gusto. ¿Es este un ejemplo de invariancia de calibre en el mismo sentido que los ejemplos de graduados anteriores?

Sí, de hecho lo es, en la definición más general de invarianza de calibre, es lo que los físicos llaman una invariancia de calibre global . Más sobre eso a continuación.

Si tuviera que escribir una respuesta de una oración a su título, sería esta:

La invariancia de calibre es la definición bien definida de la ley física bajo un mapa de comillas que condensa una configuración / espacio de parámetros / coordenadas para un sistema físico en un conjunto de clases de equivalencia de configuraciones físicamente equivalentes.

Esto es en el mismo sentido que, por ejemplo, el producto de la clase lateral está bien definido bajo el mapa que cociente de un subgrupo normal de un grupo. La física de una configuración es independiente de la elección del miembro de clase de equivalencia .

En sus términos más simples, la invariancia de calibre es simplemente una afirmación de que hay redundancia en una descripción matemática de un sistema físico. Dicho de otro modo, el sistema tiene una simetría , una invariancia con respecto a un grupo de transformaciones.

Una simetría de calibre global es aquella en la que el espacio de configuración es un producto cartesiano simple ( es decir un haz de fibras trivial) del conjunto de clases de equivalencia físicamente distintas y un parámetro redundante, como con su ejemplo de diferencia entre dos valores. Si la descripción física es una descripción lagrangiana, entonces aquí es donde el teorema de Noether pasa a primer plano e identifica las cantidades conservadas, una para cada uno de esos parámetros redundantes.El grupo de calibre, es decir, grupo de simetrías, afecta a todas las clases de equivalencia (fibras) por igual. La sustracción de un potencial constante de un potencial electrostático es una simetría, y un gran avance para la Civilización Corvid, ya que permite que los cuervos se sienten en líneas eléctricas de alta tensión y alegremente disparen la brisa juntos, discutiendo sus últimos pensamientos sobre teorías de calibre y declarando que » ¡Nunca más!» ¿Temeremos que la adición global de 22 kV al potencial electrostático pueda cambiar la física del sistema al que pertenecemos?

Sin embargo, generalmente cuando los físicos hablan de una teoría de gauge, se refieren a una en la que el grupo de simetría puede actuar de una manera más general, con un miembro del grupo diferente actuando en cada punto del espacio de configuración. El haz de fibras correspondiente ya no es trivial. Aunque querías un ejemplo más simple que la electrodinámica, no creo que haya ninguno. La fase agregada a la función de onda del electrón puede ser cualquier función suave de coordenadas, y los términos adicionales que surgen de la regla de Leibniz aplicada a las derivadas en La ecuación de movimiento de la función de onda (Dirac, Schrödinger) se absorben exactamente en la parte cerrada del potencial EM de una forma. Por cierto, como un comentario al margen, siempre me gusta visualizar el potencial EM en el espacio de Fourier, lo que podemos hacer con restricciones razonables ( por ejemplo un postulado de que solo vamos a pensar en distribuciones templadas, por ejemplo) , porque la parte espacial de la parte redundante del cuatro-potencial es entonces su componente a lo largo del vector de onda ( ie considerado como un 3-vector), y solo el componente normal al vector de onda importa físicamente: es la única parte que sobrevive $ A \ mapsto \ mathrm {d} A = F $.

Hay dos cosas que creo que debería tomar del ejemplo de EM:

  1. Aunque prácticamente conduce a un poco de complejidad adicional, conceptualmente, es solo un pequeño salto de su ejemplo simétrico de indicador global simple; simplemente permitimos que las simetrías actúen localmente en lugar de actuar en todos los puntos del espacio de configuración igualmente;

  2. Partiendo del electromagnetismo experimentalmente real , postulamos que esta invariancia de calibre m Podría ser relevante de manera más general, por lo que vemos su presencia en otros fenómenos físicos. Esto no es más que un hecho motivado por una corazonada. Experimentalmente , encontramos que esto es algo fructífero. En física, no hay un conocimiento más profundo que los resultados experimentales.

Por último, debo mencionar que las nociones de haz de fibra / calibre también son útiles cuando declaramos artificialmente clases de equivalencia de configuraciones basadas en las necesidades de nuestro problema , incluso si hay una diferencia física entre los miembros de la clase de equivalencia. Uno de los ejemplos más encantadores de esta forma de pensar es la «» Teoría del calibre del gato que cae « de Montgomery. Estudiamos clases de equivalencia de configuración de gatos que son módulo equivalente isometría euclidiana adecuada para formular un espacio con forma de gato , que, en el tratamiento estándar en el que se piensa que el gato es un robot de dos secciones con una articulación esférica sin torsión, resulta ser el plano proyectivo real $ \ mathbb {RP} ^ 2 $. Todo el espacio de configuración es entonces un paquete de fibra con el espacio de forma $ \ mathbb {RP} ^ 2 $ como base y el grupo $ SO (3) $ que define las orientaciones como fibra El gato puede voltear conservando el momento angular utilizando deformaciones cíclicas de su propia forma debido a la curvatura de la conexión que surge de la noción de transporte paralelo que implica la conservación del momento angular.

Respuesta

Aquí está el ejemplo más elemental de simetría de calibre que se me ocurre.


Suponga que quiere t o discutir algunas hormigas caminando en una banda de Möbius. Para describir las posiciones de las hormigas, es conveniente imaginarse cortando la banda a lo ancho, para que se convierta en un rectángulo. Luego me puedes decir dónde está una hormiga diciéndome tres cosas:

  • Su latitud : su posición a lo largo del ancho del rectángulo.
  • Su longitud : su posición a lo largo del rectángulo.
  • Su orientación , ya sea que se aferre a la superficie superior o inferior del rectángulo.

El significado de la longitud depende de la ubicación de ese corte imaginario. Si mueve el corte, todas las longitudes de las hormigas cambian. No puede haber ninguna razón física para preferir un corte sobre otro, porque puede deslizar la banda a lo largo de su longitud sin cambiar su forma ni afectar el comportamiento de las hormigas. palabras, no puede haber ninguna noción físicamente significativa de longitud absoluta, porque la banda tiene una simetría de traducción .

De manera similar, el significado de orientación depende de cómo etiquetes las superficies del rectángulo como arriba y abajo.No puede haber ninguna razón física para preferir un etiquetado sobre otro, porque puede intercambiar las dos superficies de la banda sin cambiar su forma o afectar el comportamiento de las hormigas. Ese intercambio es un ejemplo de una simetría de calibre . Tiene algunas características sorprendentes que no comparten las simetrías ordinarias. Echemos un vistazo a una de ellas.


Por cada simetría de una situación, hay algún aspecto de la situación. eso se puede describir de múltiples formas, sin bases físicas para elegir entre ellas. A veces, sin embargo, es útil hacer una elección y atenerse a ella, aunque la elección no tenga sentido físico. En las discusiones sobre personas que navegan por la superficie de la Tierra, por ejemplo, casi todas las personas que conozco definen la longitud utilizando un corte que atraviesa Greenwich, Londres, principalmente porque algunas personas que vivía allí se apoderó del mundo e imprimió muchas cartas náuticas.

Si hubiéramos ido a observar hormigas en una banda cilíndrica ordinaria, podríamos habernos decidido por una noción de orientación. con la misma facilidad. Pintaríamos un lado de la banda de turquesa para «arriba» y el otro lado de azul para «abajo», y eso sería todo. En una banda de Möbius, las cosas son más complicadas, ¡porque una banda de Möbius solo tiene un lado! Si intenta pintar una superficie de turquesa y la superficie opuesta de azul, comenzando en una pequeña región de la banda y moviéndose hacia afuera, las áreas turquesa y azul chocarán inevitablemente (en nuestra discusión anterior, la colisión estaba oculta a lo largo del corte de longitud).

En una situación con una simetría ordinaria, como una simetría de traducción, no puede elegir entre descripciones posibles de una manera que sea físicamente significativa. En una situación con una simetría de calibre, es posible que ni siquiera sea capaz de elegir entre descripciones posibles de una manera globalmente coherente. Sin embargo, siempre puede elegir descripciones coherentes en pequeñas regiones del espacio. Es por eso que las simetrías de calibre a menudo se llaman simetrías locales .


Después de haber intentado una descripción larga y elemental de lo que es una simetría de calibre, también me gustaría ofrecer uno corto y sofisticado. En nuestros modelos físicos más simples, los eventos tienen lugar en una variedad suave llamada espacio o espacio-tiempo . Una simetría ordinaria es un difeomorfismo del espacio-tiempo que preserva la posibilidad física de los eventos. En modelos más sofisticados, los eventos tienen lugar en un paquete de fibra durante el espacio-tiempo. Una simetría de calibre es un automorfismo del haz de fibras que preserva la posibilidad física de eventos.

En nuestro ejemplo elemental, la banda de Möbius desempeña el papel de espacio, y las hormigas caminan en la banda «s paquete de orientación. El paquete de orientación tiene un automorfismo que intercambia las dos superficies de la banda.

En el electromagnetismo clásico, el espacio-tiempo de Minkowski o alguna otra variedad de Lorentz desempeña el papel del espacio-tiempo, y el campo electromagnético está representado por un conexión en un paquete circular sobre el espacio-tiempo. En la imagen de Kaluza-Klein , las partículas cargadas se mueven en el paquete circular, volando en líneas rectas cuyas «sombras» en el espacio-tiempo son los caminos en espiral que vemos. El haz circular tiene una familia de automorfismos que rotan las fibras circulares, que la gente elegante llama simetría $ \ operatorname {U} (1) $ gauge. Esta imagen generaliza a todas las teorías clásicas de Yang-Mills.

En la imagen Palatini de la relatividad general, una variedad suave de $ 4 $ -dimensional juega el papel del espacio-tiempo, y el campo gravitacional está representado por un $ \ operatorname {SO} (3,1) $ conexión en el conjunto del marco del colector. Sospecho que las simetrías de calibre de la gravedad linealizada que mencionaste son automorfismos del conjunto de marcos.

En la imagen de Einstein de la relatividad general, las simetrías son difeomorfismos del espacio-tiempo. Las clasifico como simetrías ordinarias, más bien que las simetrías de calibre. Como tparker mencionó , sin embargo, no todos usan el término «simetría de calibre» de la misma manera.

Comentarios

  • ¡Maravilloso! La idea de la banda M ö bius es simplemente hermosa, y realmente captura toda la esencia de ideas mucho más complicadas. También me gusta de cómo el flujo de ideas muestra cómo lo simple se generaliza sin problemas.
  • Oye, ¿qué ‘ s con los tres votos? No sé qué ‘ s mal con los merodeadores en este sitio, esta es la mejor respuesta a esta pregunta hasta ahora, dados los requisitos de OP ‘. De todos modos, uno de los votos es mío.
  • @WetS avannaAnimalakaRodVance, yo no ‘ no me preocuparía por el número de votos. Si conoce a alguien que podría beneficiarse de esta respuesta, puede vincularlo directamente.Como referencia, funciona tan bien en la parte inferior de la lista de respuestas ordenadas por votos como en la parte superior.

Responder

Existe una interpretación física muy interesante de la invariancia de calibre en el caso de la simetría $ U (1) $. La simetría de calibre es la única forma de obtener la interacción invariante de Lorentz de la materia (en el sentido amplio, el campo de giro arbitrario) y los fotones (que son partículas sin masa con helicidad 1), que disminuye como $ \ frac {1} {r ^ { 2}} $ a grandes distancias (esta afirmación no es más que la ley de Coulomb). Brevemente, $ A _ {\ mu} $ de 4 potenciales, que proporciona la ley del cuadrado inverso de las interacciones EM, no es covariante de Lorentz, y la manifestación de la invariancia de Lorentz de interacción conduce a la conservación local de carga.

Realmente, se puede demostrar a partir de consideraciones muy generales, basadas en la simetría de nuestro espacio-tiempo, que los fotones son presentados por el 4-tensor antisimétrico $ F _ {\ mu \ nu} $, llamado Tensor de fuerza EM . Es covariante de Lorentz formalmente (mediante el uso de manipulaciones ingenuas con índices de tensor) y por construcción (como el campo que representa partículas con helicidad 1), es decir, bajo Transformación de Lorentz dada por la matriz $ \ Lambda _ {\ mu} ^ {\ \ nu} $ se transforma como $$ F _ {\ mu \ nu} \ a \ Lambda _ {\ mu} ^ {\ \ alpha} \ Lambda _ {\ nu} ^ {\ \ beta} F _ {\ alpha \ beta} $$ Luego, suponga que tenemos campos de materia $ \ psi $ y discutimos una interacción de materia con fotones. La forma más obvia de obtener dicha interacción es obtenerla por construyendo todas las convoluciones posibles de $ F _ {\ mu \ nu} $ con campos de materia y objetos covariantes de Lorent (matrices de Dirac, conexión Levi-Civita, etc.). Supongamos también que sabemos por el experimento que la interacción cae como $ \ frac {1} {r ^ {2}} $ a gran distancia. Desafortunadamente, esto es imposible si usamos $ F _ {\ mu \ nu} $. La razón formal es que el propagador de este campo, que muestra la ley de interacción, cae más rápido que $ \ frac {1} {r ^ {2}} $. Esto se debe a dos índices y antisimetría de $ F _ {\ mu \ nu} $.

Podemos hacer alguna pista e introducir el objeto $ A _ {\ mu} $ con un índice, llamado 4-potenciales : $$ F _ {\ mu \ nu} = \ partial _ {\ mu} A _ {\ nu} – \ partial _ {\ nu} A _ {\ mu} $$ Las interacciones ahora se construyen mediante convoluciones de $ A_ { \ mu} $ con campos de materia y otros objetos covariantes.

Por supuesto, requerimos que $ A _ {\ mu} $ represente partículas de helicidad 1 sin masa así como $ F _ {\ mu \ nu} $. Desafortunadamente, este requisito conduce a la afirmación de que 4-potencial no es covariante de Lorentz (aunque formalmente lo es, por supuesto). Precisamente, bajo Lorentz campo de transformación $ A _ {\ mu} $, que se supone que representa partículas sin masa de helicidad 1, se cambia como $$ \ tag 1 A _ {\ mu} \ a \ Lambda _ {\ mu} ^ {\ \ nu} A _ {\ nu} + \ partial _ {\ mu} \ varphi $$ Vemos que no es covariante de Lorentz. El lagrangiano libre para $ A _ {\ mu} $, que es solo $$ L = – \ frac { 1} {4} F _ {\ mu \ nu} F ^ {\ mu \ nu}, $$ es invariante de Lorentz.

Pero hay una forma de preservar la invariancia de interacciones de Lorentz. Esta es constrúyalos para que sean invariantes bajo la transformación $ A _ {\ mu} \ a A _ {\ mu} + \ parcial _ {\ mu} \ varphi $. Precisamente, la amplitud de interacción $ M _ {\ mu_ {1} … \ mu_ {n}} (p_ {i}, \ epsilon_ {j} (k_ {j})) $, donde $ \ epsilon $ son vectores de helicidad de fotones (polarización), $ p_ {i} $ son todos los momentos de interacción partículas y $ k_ {j} $ siendo momentos de fotones), debe b e invariante bajo transformación $$ \ tag 2 \ epsilon _ {\ mu} (p) \ to \ epsilon _ {\ mu} (p) + \ alpha p _ {\ mu} $$ En el lenguaje formal, como se puede mostrar por tratando procesos con emisión de fotones suaves (fotones con momentos casi nulos), esto significa que debe haber una ley de conservación de los acoplamientos de materia $ g_ {i} $: $$ g_ {1} + g_ {2} + … = \ text {const} $$ Esto no es más que la ley de conservación de cargas. Junto con $ (2) $ esto no es más que $ U (1) $ simetría de calibre.

Entonces, vemos que la invariancia de Lorentz de las interacciones de los fotones con la materia por la ley del cuadrado inverso conduce a la invariancia de calibre. Analógicamente se puede argumentar el principio de equivalencia para el caso de la interacción de los gravitones con todos los campos.

Respuesta

Las teorías de calibre describen la conectividad de un espacio con dimensiones extra pequeñas y simétricas

Comience con un cilindro infinito (el producto directo de una línea y un círculo pequeño). El cilindro se puede torcer. Para evitar apelar a conceptos que estoy tratando de explicar, solo diré que el cilindro está hecho de malla de alambre: círculos espaciados uniformemente soldados a alambres que corren a lo largo del mismo. Los cables largos pueden girar como una unidad, introduciendo un giro angular entre cada par de círculos adyacentes. Está claro que cualquier configuración de este tipo puede deformarse continuamente en cualquier otra: todos estos cilindros son equivalentes desde la perspectiva de la proverbial hormiga que se arrastra sobre ellos.

Reemplace la línea con un bucle cerrado, de modo que el producto sea un toro (y piense en el toro como una rosquilla de malla, aunque variar el plano de los círculos pequeños de esa manera técnicamente rompe la analogía). Cualquier porción de la rosquilla que no esté completa se puede deformar en la misma porción de cualquier otra rosquilla, pero las rosquillas en su conjunto a veces no pueden serlo, porque el giro neto alrededor de la rosquilla no se puede alterar. Las clases de donas equivalentes se caracterizan completamente por este giro neto, que es inherentemente no local.

Reemplace el bucle (no el círculo pequeño) con una variedad de dos o más dimensiones. Es cierto, aunque no obvio, que la parte física de la conexión está completamente dada por el giro integrado alrededor de todos los bucles cerrados ( bucles Wilson ).

$ A $ y $ F $ cuantifican la conectividad

En el caso discreto, la conexión se puede describir de manera más simple dando el giro entre círculos adyacentes. En el límite continuo, esto se convierte en un «gradiente de torsión» en cada círculo. Esto es $ A_ \ mu $, el llamado potencial vectorial.

Cualquier deformación continua se puede describir mediante un campo escalar $ \ phi $ que representa la cantidad que cada círculo está retorcido (en relación a donde estaba antes). Esto altera $ A_ \ mu $ por el gradiente de $ \ phi $, pero no cambia ninguna cantidad física (integral de bucle).

La descripción en términos de los bucles de Wilson, $ \ oint_ \ gamma A \ cdot \, \ mathrm dx $, es más elegante porque solo incluye cantidades físicamente significativas, pero no es local y es altamente redundante. Si el espacio está simplemente conectado, puede evitar El r edundancia y no localidad especificando el giro solo alrededor de los bucles diferenciales, ya que se pueden construir bucles más grandes a partir de ellos. El llamado tensor de campo, $ \ parcial_ \ nu A_ \ mu – \ parcial_ \ mu A_ \ nu = F _ {\ mu \ nu} $, te da exactamente eso.

(Si el espacio es no está simplemente conectado, todavía puede salirse con la suya con los bucles diferenciales más un giro neto para cada elemento de un grupo electrógeno del grupo fundamental . El toro fue por supuesto un ejemplo simple de esto.)

La fuerza proviene del efecto Aharonov – Bohm

Considere un campo escalar definido en todo el espacio (a diferencia de los campos anteriores, este toma un valor en cada punto de cada círculo). El campo es cero en todas partes, excepto por dos haces estrechos que divergen de un punto y vuelven a converger en otro lugar. (Tal vez se reflejen en espejos; tal vez el espacio esté curvado positivamente; no importa.)

A menos que el campo sea constante a través de los círculos, el comportamiento de interferencia de los rayos dependerá de la diferencia en el giro a lo largo de los dos caminos. Esta diferencia es solo la integral alrededor del circuito cerrado formado por las rutas.

Este es el efecto (generalizado) Aharonov – Bohm. Si lo restringe a caminos diferenciados y usa $ F _ {\ mu \ nu} $ para calcular el efecto sobre la interferencia, obtiene la ley de fuerza electromagnética.

Puede descomponer el campo en componentes de Fourier. El espectro de Fourier es discreto en la pequeña dimensión. El armónico cero (constante) no se ve afectado por la torsión. El segundo armónico se ve afectado dos veces más que el primero. Estas son las cargas eléctricas.

En realidad, por razones desconocidas, solo parecen existir ciertos armónicos extradimensionales. Si solo existe el primer armónico, hay una descripción equivalente del campo como una única amplitud compleja + fase en cada punto de las grandes dimensiones. La fase es relativa a un punto cero local arbitrario que también es utilizado por el potencial vectorial. Cuando compara la fase con la fase en un punto cercano, y hay un giro potencial de vector de $ \ mathrm d \ theta $ entre ellos, necesita ajustar el valor del campo en $ i \, \ mathrm d \ theta $ . Este es el origen de la derivada covariante de calibre .

Los círculos se generalizan a otras formas

Si reemplaza el círculos con 2 esferas, obtienes una teoría de calibre $ \ mathrm {SU} (2) $. Es más desagradable numéricamente: el grupo de simetría no es conmutativo, por lo que debes incorporar la maquinaria del álgebra de Lie. Geométricamente, sin embargo, nada Mucho ha cambiado. La conectividad todavía se describe mediante un giro neto alrededor de los bucles.

Una diferencia desafortunada es que la descripción de la carga como armonía extradimensional cs ya no funciona. Los armónicos esféricos le dan solo las representaciones de espín entero, y todas las partículas conocidas están en las representaciones de espín-0 o espín-½ del modelo estándar $ \ mathrm {SU} (2) $, por lo que las partículas que se ven afectadas por el $ \ mathrm {SU} (2) $ force en absoluto no se puede describir de esta manera. Puede haber una manera de solucionar este problema con un tipo de campo más exótico.

No tengo nada interesante que decir sobre la parte $ \ mathrm {SU} (3) $ del grupo de indicadores del modelo estándar, excepto para señalar que todo el grupo de indicadores SM se puede incrustar en $ \ mathrm {Spin} (10) $ , y creo que es más fácil visualizar una esfera de 9 que una forma con $ \ mathrm {SU} (3) $ simetría.

La relatividad general es similar

En la relatividad general, el tensor de curvatura de Riemann es análogo al tensor de campo; representa la rotación angular de un vector transportado alrededor de un bucle diferencial. El efecto Aharonov-Bohm es análogo al déficit angular alrededor de una cuerda cósmica . Teoría de Kaluza-Klein originalmente se refería a una forma específica de obtener electromagnetismo de la relatividad general en cinco dimensiones; ahora, a menudo se refiere a la idea amplia de que las fuerzas de calibre del Modelo Estándar y la relatividad general probablemente sean aspectos diferentes de la misma cosa.

Respuesta

En Electrodinámica Clásica (CED) la invariancia de calibre significa independencia de los campos eléctricos y magnéticos de una «elección» particular de los potenciales $ \ varphi $ y $ \ bf {A} $. La ecuación de los potenciales depende, por supuesto, de la elección particular del «calibre», y dan diferentes soluciones para diferentes calibres.

En QM y QED la invariancia de calibre también significa «invariancia» de forma de ecuaciones (las soluciones siguen siendo diferentes, pero físicamente equivalentes).

Pero uno debe seguir Tenga en cuenta que cualquier cambio de variable útil también es aceptable si los resultados correspondientes permanecen físicamente iguales. Para eso, la forma de las ecuaciones no debería ser obligatoriamente «invariante» en absoluto.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *