Kapitel 5
Die allgemeine Relativitätstheorie

3   Die Einsteinschen Feldgleichungen

Aus dem letzten Kapitel ( Kapitel 5.2 Das Einsteinsche Äquivalenzprinzip ) wissen wir, dass in der allgemeinen Relativitätstheorie lokal kein Unterschied zwischen einem beschleunigten Bezugssystem und einer Gravitationswirkung besteht. Daher kann man lokal auch immer ein frei fallendes Bezugssystem finden, in dem man Gravitation nicht spürt. Aber: Weit entfernte Objekte nehmen wir in einem Gravitationsfeld zumeist als beschleunigt wahr, auch wenn wir uns selber im freien Fall befinden. Ein Beispiel sind zwei Satelliten, die auf verschiedenen Bahnen die Erde umkreisen. In jedem Satelliten spürt man keine Gravitation, aber der jeweils andere Satellit erscheint den schwerelosen Insaßen des einen Satelliten als beschleunigt (d.h. er bewegt sich nicht auf einer geradlinig-gleichförmigen Bahn im Bezugssystem des einen Satelliten). Die Unmöglichkeit, ein globales Bezugssystem zu finden, in dem sich alle frei fallenden Objekte unbeschleunigt zueinander bewegen, ist daher in der allgemeinen Relativitätstheorie die kennzeichnende Eigenschaft von Gravitation. Mathematisch verhindert Gravitation, dass man global die Raumzeit mit karthesischen Koordinaten und Minkowski-Metrik beschreiben kann. Aus der Differentialgeometrie weiß man, dass dies genau dann unmöglich ist, wenn der Riemannsche Krümmungstensor ungleich Null ist:

Was ist die Ursache für diese nicht-verschwindende Krümmung der Raumzeit?

Im Newtonschen Gravitationsgesetz entsteht Gravitation durch die Anwesenheit von Masse. Man muss also versuchen, das Newtonsche Gravitationsgesetz durch eine koordinaten-unabhängige (tensorielle) Beziehung zwischen Materie und Raum-Zeit-Krümmung zu verallgemeinern, so dass sich im nichtrelativistischen Grenzfall wieder das Newtonsche Gravitationsgesetz ergibt.

Es ist keineswegs einfach, diese Verallgemeinerung zu finden, und auch Einstein hat dafür einige Zeit benötigt. So erinnert sich Einstein im Juni 1933 an die Jahre vor 1915:

Man kann das verallgemeinerte Gravitationsgesetz nicht streng ableiten oder beweisen, sondern man kann nur intelligent raten, wie es aussehen sollte, und dann die physikalischen Konsequenzen des gefundenen Gesetzes untersuchen und letztlich im Experiment verifizieren. Die folgende Darstellung orientiert sich u.a. an Kapitel 4 Einstein field equations in Matt Visser: notes on general relativity, Math 465, http://www.mcs.vuw.ac.nz/courses/MATH465/2004T2/Lecture-Notes/notes.ps -- im Folgenden mit [MV] abgekürzt. Die Rechnungen werde ich dabei nicht im Detail hier wiederholen, sondern ggf. kurz inhaltlich zusammenfassen.

Das Newtonsche Gravitationsgesetz für das Gravitationspotential Φ lautet für eine Massendichte ρ allgemein

  div (grad Φ)   =   4πGN ρ

mit der Gravitationskonstante GN (das tiefergestellte N steht für Newton und dient zur Unterscheidung vom Einstein-Tensor G, den wir bald benötigen). Bei einer punktförmigen Materieansammlung der Gesamtmasse M im Koordinaten-Nullpunkt ergibt sich nach dem Integralsatz von Stokes bei Integration über ein Kugelvolumen B(r) mit Radius r bzw. Integration über die Kugeloberfläche δB(r) :

  ∫B(r)   div (grad Φ) dV   =   ∫δB(r)   (grad Φ) dA   =   |grad Φ| 4π r2
  ∫B(r)   4πGN ρ dV   =:   4πGN M
  →     |grad Φ|   =   GN M / r2

und somit das bekannte Newtonsche Gravitationsgesetz.

Wie kann man nun versuchen,   div (grad Φ)   =   4πGN ρ   zu verallgemeinern? Bei der beschleunigten Rakete hatten wir gesehen, dass die Gravitationsbeschleunigung (also klassisch die Gravitationskraft) durch das Christoffelsymbol   Γi00   entsteht (siehe Kapitel 5.2 Das Einsteinsche Äquivalenzprinzip ). Dies lässt sich auch ganz allgemein für die Beschleunigung eines zuvor ruhenden Objektes zeigen (siehe [MV] Kapitel 3.3). Also muss im nichtrelativistischen Grenzfall   Γi00   proportional zur klassischen Gravitationsbeschleunigung   (grad Φ)i   sein. Das Newtonsche Gravitationsgesetz enthält nun wiederum zweite Ableitungen des Gravitationspotentials Φ, was ersten Ableitungen der Christoffelsymbole entspricht. Die linke Seite   div (grad Φ)   des verallgemeinerten Gravitationsgesetzes wird also vermutlich Christoffelsymbole (wollen wir nicht ausschließen) und erste Ableitungen dieser Symbole enthalten. Welche koordinatenunabhängigen Objekte (Tensoren), die sich so bilden lassen, kommen für das verallgemeinerte Gravitationsgesetz in Frage?

Zur Klärung dieser Frage ist es nützlich, sich zunächst Raumbereiche anzusehen, in denen sich keine Materie oder irgendwelche Energieformen (z.B. Licht) befinden. Das bedeutet nicht, dass in diesen Raumbereichen keine Gravitation herrscht, denn die Materie kann sich ja außerhalb des betrachteten Raumbereichs befinden. So könnten wir uns beispielsweise für den materiefreien Raum um einen Stern herum interessieren (zumindest wollen wir ihn als weitgehend materiefrei ansehen).

Das Newtonsche Gravitationsgesetz für leere Raumbereiche lautet   div (grad Φ)   =   0  . Wir suchen nun einen geeigneten Tensor, der erste Ableitungen der Christoffelsymbole enthält und der an die Stelle der linken Seite dieser Gleichung tritt (der also für leere Raumbereiche gleich Null ist). Zum Glück gibt es nicht allzuviele Kandidaten, denn die Bedingung, dass ein Tensor entstehen muss (der in Koordinatendarstellung das entsprechende Transformationsverhalten bei Koordinatenwechseln aufweisen muss), schränkt die Kombinationsmöglichkeiten erheblich ein. Schauen wir uns die Kandidaten der Reihe nach an:


Der Riemannsche Krümmungstensor:

Den Riemannschen Krümmungstensor hatten wir in Kapitel 5.1.8 Krümmung bereits ausführlich diskutiert. Hier eine kurze Wiederholung:

Der Riemannsche Krümmungstensor   Rμνρσ   kann koordinatenfrei als Abbildung   R(u,v)   definiert werden, so dass der Ausdruck   R(u,v) w   ein Tangentialvektor ist. Dabei gibt   R(u,v) w   (geeignet normiert) an, wie sich der Tangentialvektor w verändert, wenn er entlang eines durch u und v aufgespannten infinitesimalen Rechtecks im Kreis paralleltransportiert wird. In Komponenten ist

  [R(u,v) w]μ   =   ∑νρσ   Rμνρσ   wν uρ vσ  

und es gilt

  Rμνρσ   =   dΓ μσν / dxρ   −   dΓ μρν / dxσ   +   ∑α ( Γ μρα Γ ασν   −   Γ μσα Γ αρν )

d.h. der Krümmungstensor enthält wie gewünscht erste Ableitungen der Christoffelsymbole. Man erkennt, dass   Rμνρσ   antisymmetrisch in den letzten beiden Indices ist.

Ist dieser Tensor ein geeigneter Kandidat, den wir in materiefreien Raumbereichen gleich Null setzen können, auch wenn Gravitation vorliegt?

Aus dem letzten Kapitel wissen wir, dass dies bedeuten würde, dass sich überall im materiefreien Raumbereich ein einziges Inertialsystem einführen ließe, so dass in dem Raumbereich keinerlei Gravitation herrschen würde. Die Christoffelsymbole wären in diesem Koordinatensystem alle im gesamten materiefreien Raumbereich gleich Null. Das würde viel zu weit gehen, denn wir könnten beispielsweise die Gravitation im leeren Raum um einen Stern herum nicht beschreiben. Der Riemannsche Krümmungstensor ist also kein geeigneter Kandidat für das verallgemeinerte Gravitationsgesetz!


Der Ricci-Tensor:

Den Ricci-Tensor hatten wir bereits am Ende des letzten Kapitels kennengelernt. Man gewinnt ihn aus dem Riemannschen Krümmungstensor durch Kontraktion des ersten mit dem dritten Index:

  Rνσ   :=   ∑μ   Rμνμσ

Entsprechend schreiben wir

  Ric(w,v)   :=   ∑νσ   Rνσ wν vσ  

Dieser Ausdruck hängt nicht vom Koordinatensystem ab. Im letzten Kapitel hatten wir deshalb auch die folgende koordinatenfreie Formulierung kennengelernt:

  Ric(w,v)   :=   Spur( R( ,v) w )  

Ohne Torsion (was in unserem Fall zutrifft) ist der Ricci-Tensor symmetrisch (analog zur Metrik). In 2 und 3 Dimensionen reicht der Ricci-Tensor zur Beschreibung der Krümmung vollständig aus. In 4 Dimensionen (also auch in der Raumzeit) benötigt man zur vollständigen Charakterisierung der Krümmung allerdings den Riemannschen Krümmungstensor von oben. Und genau das ist hier von Vorteil, denn in der vierdimensionalen Raumzeit ist demnach der Krümmungstensor durch den Ricci-Tensor nicht eindeutig festgelegt. Wenn wir also für materiefreie Raumbereiche   Rνσ = 0   fordern würden, so kann die Krümmung dennoch ungleich Null sein und Gravitation könnte damit auch in materiefreien Raumbereichen durch eine nicht-verschwindende Krümmung beschrieben werden. Daher kommt der Ricci-Tensor als Kandidat für das verallgemeinerte Gravitationsgesetz in Frage.


Andere Kontraktionen des Krümmungstensors:

Man kann sich natürlich fragen, warum man oben ausgerechnet den ersten mit dem dritten Index im Riemannschen Krümmungstensor kontrahiert.

Wegen der Antisymmetrie in den letzten beiden Indices hätte man auch den ersten mit dem vierten Index kontrahieren können. Das Ergebnis wäre der Ricci-Tensor mit negativem Vorzeichen, also nichts wesentlich Neues.

Man hätte auch den ersten mit dem zweiten Index kontrahieren können:

  Sρσ   :=   ∑μ   Rμμρσ

Dieser Tensor ist in der allgemeinen Relativitätstheorie gleich Null (siehe [MV2] Kapitel 3.6 Riemann curvature S.58) und spielt daher keine Rolle. So ist es offenbar auch mit anderen Kontraktionen: Aufgrund der Symmetrien des Riemannschen Krümmungstensors (Bianchi-Identitäten etc.) sind sie entweder Null oder im Wesentlichen gleich dem Ricci-Tensor.


Der Weyl-Tensor:

Aufgrund der Symmetrien hat der Riemannsche Krümmungstensor in 4 Dimensionen nur 20 unabhängige Komponenten. Davon kann man 10 unabhängige Komponenten dem obigen Ricci-Tensor zuordnen. Die anderen 10 unabhängigen Komponenten wiederum kann man dem sogenannten Weyl-Tensor zuordnen (siehe [MV2] Kapitel 6.8 The Weyl tensor -- Details lasse ich hier weg). Man könnte also alternativ zum Ricci-Tensor auch den Weyl-Tensor als Kandidaten für das verallgemeinerte Gravitationsgesetz in Betracht ziehen. Auch hier könnte man in materiefreien Raumbereichen diesen Tensor gleich Null setzen und behielte noch Freiheitsgrade im Krümmungstensor, um die Gravitation in diesem Raumbereich zu beschreiben. Dies wurde im Rahmen von Nordstroms konform-flachen Modell in den Jahren bis etwa 1920 tatsächlich auch versucht.

Der Weyl-Tensor hat nun eine charakteristische Eigenschaft: Führt man eine konforme Transformation der Koordinaten durch (d.h. in neuen Koordinaten ist die metrische Matrix gleich der alten metrischen Matrix mal einer positiven Konstanten Ω2 ), so ist auch der Weyl-Tensor in neuen Koordinaten gleich dem Weyl-Tensor in alten Koordinaten multipliziert mit Ω2 .

Man kann nun zeigen: Wenn der Weyl-Tensor in einem Raumbereich gleich Null ist, so ist der Raum dort konform-flach, d.h. die Metrik ist gleich der Minkowski-Metrik, multipliziert mit Ω2 . Nun werden Lichtstrahlen durch Geodäten dargestellt, bei denen der Tangentialvektor u überall Metrik gleich Null hat: g(u,u) = 0 (man spricht deshalb auch von Null-Geodäten). Diese Aussage ändert sich auch durch Umparametrisierungen nicht. Der Kurvenparameter ist bei solchen lichtartigen Kurven natürlich nicht gleich der Eigenzeit, da diese für diese Kurven nicht definiert ist -- Licht altert nicht! Man kann nun zeigen, dass in konform-flachen Räumen die Null-Geodäten (also Lichtstrahlen) genauso aussehen wie im Minkowskiraum der speziellen Relativitätstheorie, d.h. es gibt keine Lichtablenkung durch die Gravitation. Das aber wiederspricht den experimentellen Resultaten, d.h. Nordstroms konform-flaches Modell und damit der Weyl-Tensor scheiden als Kandidaten für das verallgemeinerte Gravitationsgesetz aus!. Man sieht, wie komplex die Sache im Detail ist und welche Möglichkeiten es gibt. Einsteins verallgemeinertes Gravitationsgesetz liegt also keineswegs selbstverständlich auf der Hand, wie man bei der Lektüre so mancher Texte annehmen könnte.


Der Ricci-Skalar:

Auch den Ricci-Skalar hatten wir am Ende des letzten Kapitels bereits kennengelernt. Mit Hilfe der inversen metrischen Matrix kann man nämlich die Spur über die Indices des Ricci-Tensors bilden und so den Ricci-Skalar (auch skalare Krümmung genannt) definieren (siehe z.B. http://en.wikipedia.org/wiki/Ricci_scalar ):

  R   :=   ∑νσ   gνσ Rνσ   =:   Spurg ( Ric )

wobei das kleine g bei der Spur unten andeutet, dass vor der Spurbildung der erste Index mit der Metrik hochgezogen wird. Für die Definition des Ricci-Skalars benötigt man also eine Metrik! Der Ausdruck für R hängt nicht vom Koordinatensystem ab. In 2 Dimensionen (also bei Flächen) reicht der Ricci-Skalar zur Beschreibung der Krümmung vollständig aus, aber nicht mehr in 3 Dimensionen.

In materiefreien Raumbereichen wäre dann der Ricci-Skalar gleich Null zu setzen. Das würde jedoch für den Krümmungstensor noch sehr viele Freiheiten bedeuten und führt zu sehr merkwürdigen Lösungen für die Raum-Zeit-Geometrie der materiefreien (aber nicht gravitationsfreien) Raumzeit ([MV] erwähnt z.B. sogenannte traversable wormhole solutions). Solche Lösungen sind nicht möglich, wenn wir den Ricci-Tensor gleich Null setzen.


Wenn man sich die verschiedenen Möglichkeiten ansieht, so gelangt man zu dem Schluss, dass der Ricci-Tensor am geeignetsten erscheint, um die linke Seite des Newtonschen Gravitationsgesetzes   div (grad Φ)   =   4πGN ρ   zu verallgemeinern. Im materiefreien Raum wäre dann den Ricc-Tensor gleich Null, was genau das richtige Maß an Freiheit für den Krümmungstensor erlaubt. Weiter unten werden wir sehen, dass wir damit fast richtig, aber dennoch nicht ganz richtig geraten haben. Mehr dazu später.


Der Energie-Impuls-Tensor:

Kommen wir zur rechten Seite des Newtonschen Gravitationsgesetzes   div (grad Φ)   =   4πGN ρ   . Wie können wir die Materiedichte so verallgemeinern, dass sich eine sinnvolle tensorielle Gleichung ergibt?

Eine sehr schöne Darstellung dazu habe ich in [MV] Kapitel 4.3 ff. gefunden:

Gravitation beschreibt in der allgemeinen Relativitätstheorie die Tatsache, dass man kein großräumiges Inertialsystem einführen kann, in dem sich alle frei fallenden Objekte unbeschleunigt bewegen. Es liegt daher nahe, sich die Bewegung zweier frei fallender Körper anzusehen und zu untersuchen, wie die Flugbahnen auseinander laufen. Um die Diskussion einfach zu halten, nehmen wir an, dass die beiden Körper sehr dicht beieinander starten.

In der Newtonschen Physik sieht das Ganze dann so aus: Zwei frei fallende Teilchen bewegen sich auf zwei eng benachbarten Flugbahnen x(t) und y(t) . Es gelten im Gravitationspotential Φ die Bewegungsgleichungen

  d2/dt2 x(t)   =   − grad Φ(x(t))
  d2/dt2 y(t)   =   − grad Φ(y(t))

Der kleine Abstand   dx(t) = y(t) − x(t)   zwischen den beiden Punkten entwickelt sich demnach im Gravitationspotential zeitlich so:

  d2/dt2 dx(t)   =   d2/dt2   ( y(t) − x(t) )   =   − grad ( Φ(y(t)) − Φ(x(t)) )   =   − grad ( grad Φ(x(t)) dx(t))   +   ... )

oder in Komponenten mit der Abkürzung   Kij   :=   d2Φ / (dxi dx j)   :

  d2/dt2 dxi(t)   =   − ∑j   Kij   dx j(t)   +   ...

Andererseits ist   Spur(K)   =   ∑i   Kii   =   ∑i   d2Φ / (dxi)2   =   div (grad Φ)   =   4πGN ρ  . Diese Gleichung verbindet also den Gezeitenkräfte-Tensor K mit der Anwesenheit von Materie in der Newtonschen Gravitationstheorie.


Analog kann man auch in der allgemeinen Relativitätstheorie vorgehen. An die Stelle der obigen Bewegungsgleichungen treten die Geodätengleichungen mit den Christoffelsymbolen. Nach längerer Rechnung (siehe [MV] Kapitel 4.4) ergibt sich:

  d2/dτ2 dxμ(τ)   =   − ∑σ   Kμσ   dxσ(τ)   +   ...

mit   Kμσ   :=   − ∑νρ   Rμνρσ   uν uρ   , wobei u der Tangentialvektor (Vierer-Geschwindigkeitsvektor) der Bewegung eines der Teilchen ist (egal welches, da sie auf sehr ähnlichen Flugbahnen fliegen sollen) und τ entsprechend die zugehörige Eigenzeit ist. [MV] bezeichnet die obige Gleichung auch als equation of geodesic deviation. Man sieht schön, dass der Krümmungstensor hier die Ursache für das Auseinanderlaufen der Geodäten ist. In John Baez, Emory Bunn: The Meaning of Einstein's Equation, http://math.ucr.edu/home/baez/einstein/einstein.pdf wird diese Gleichung ebenfalls hergeleitet, allerdings direkt (ohne lange Rechnung) mit Hilfe der geometrischen Definition des Krümmungstensors durch Parallelverschiebung entlang eines infinitesimalen Rechtecks (siehe oben sowie Kapitel 5.1.8 Krümmung ).

Die relativistische Gleichung sieht ganz analog zur Gleichung der Newtonschen Physik aus. Sie sollte im nichtrelativistischen Grenzfall bei schwacher Gravitation in letztere übergehen. Was uns aber noch fehlt, ist das relativistische Analogon zur nichtrelativistischen Gleichung   Spur(K)   =   4πGN ρ   , die das Newtonsche Gravitationsgesetz beschreibt. Wir wollen daher für dieses relativistische Analogon den folgenden Ansatz machen:

  Spur(K)   =   4πGN ρ(u)  

Dabei ist ρ(u) die relativistisch verallgemeinerte Materiedichte, wie sie ein Beobachter messen würde, der sich mit Vierergeschwindigkeit u bewegt -- was das bedeuten soll, müssen wir uns gleich noch überlegen. Für die linke Seite können wir schon mal ausrechnen (wobei wir die Antisymmetrie des Krümmungstensors in den letzten beiden Indices verwenden):
  Spur(K)   =   − ∑μνρ   Rμνρμ   uν uρ   =   ∑μνρ   Rμνμρ   uν uρ   =   ∑νρ   Rνρ   uν uρ   =   Ric(u,u)
so dass unser Ansatz für ein verallgemeinertes Gravitationsgesetz lautet:

  Ric(u,u)   =   4πGN ρ(u)  

Das passt sehr gut zu unserer Überlegung weiter oben, in der wir den Ricci-Tensor für materiefreie Raumbereiche gleich Null setzen wollten. Genau das erhalten wir, wenn wir in unserem Ansatz jetzt   ρ(u)   gleich Null setzen und für u beliebige Geschwindigkeiten zulassen. Bisher ist unser langsames Vortasten in Richtung eines relativistischen Gravitationsgesetzes zumindest konsistent.

Bleibt die Frage: Was ist   ρ(u)   nun genau?

In der nichtrelativistischen Newtonschen Physik war ρ eine Massendichte. Ist zu erwarten, dass in der allgemeinen Relativitätstheorie ebenfalls nur Massen ein Gravitationsfeld erzeugen? Das wäre sehr merkwürdig, da schon in der speziellen Relativitätstheorie (träge) Masse in Energie umgewandelt werden kann. Angenommen, wir haben ein massives Teilchen vor uns, z.B. ein neutrales Pion. Dieses kann spontan in zwei masselose Photonen zerfallen. Wenn Gravitation nur von massiven Teilchen erzeugt würde, so würde diese Gravitation beim Zerfall des Teilchens in masselose Objekte plötzlich ausgeschaltet, was ziemlich unplausibel klingt. Plausibler wäre es, wenn auch bezüglich der Gravitationserzeugung Energie und Masse gleichwertig zueinander wären, so wie dies bezüglich der Trägheit bereits aufgrund der speziellen Relativitätstheorie der Fall ist. Die beiden Photonen, die beim Zerfall des Pions entstehen, sollten also genauso wie das Pion zuvor auch ein Gravitationsfeld erzeugen.

Massen- und Energiedichten werden in der speziellen Relativitätstheorie nicht durch eine skalare Funktion, sondern durch den sogenannten Energie-Impuls-Tensor dargestellt. Nur so kann man die relativistischen Zusammenhänge zwischen Massendichten, Energiedichten und Impulsen sowie deren Flüsse korrekt darstellen (wir gehen weiter unten noch genauer darauf ein). Das passt gut zur obigen Gleichung   Ric(u,u)   =   4πGN ρ(u)  , denn auch aufgrund dieser Gleichung ist es naheliegend, für   ρ(u)   einen Tensoransatz zu machen:   ρ(u) c4   =:   T(u,u)   mit einem Tensor T, der genau wie der Ricci-Tensor aus zwei Tangentialvektoren u und v eine reelle Zahl (nämlich T(u,v) ) macht. Wir wollen annehmen, dass dieser symmetrische Tensor gerade der Energie-Impuls-Tensor ist (deshalb der Faktor c4, denn so erreichen wir, dass T00 die Dimension einer Energiedichte hat, wie wir gleich sehen werden). In Komponenten schreiben wir wieder
  T(u,v)   =   ∑μν   Tμν   uμ vν
so dass wir für unseren Ansatz für das verallgemeinertes Gravitationsgesetz die Gleichung
  Rμν   =   4πGN Tμν / c4  
erhalten. Wir werden etwas weiter unten noch sehen, dass wir hier noch eine kleine Änderung einbauen müssen. Zunächst aber wollen wir uns den Energie-Impuls-Tensor genauer ansehen:


Der Energie-Impuls-Tensor von Staub:

Die einfachste Form einer Materieverteilung, die Gravitation erzeugen kann, bezeichnen wir als Staub. Darunter stellen wir uns eine Wolke kleiner frei fallender Staubkörnchen vor, die sich in einem bestimmten Bezugssystem alle in Ruhe befinden. Diese Aussage macht natürlich streng genommen nur lokal Sinn. Wir werden daher im folgenden immer nur kleine Raumbereiche separat betrachten, so dass wir in diesen Raumbereichen Riemannsche Normalkoordinaten einführen können und die metrische Matrix in diesen Koordinaten annähernd die Minkowski-Matrix ist. Wir setzen uns damit in das lokale momentane Ruhe-Inertialsystem eines kleinen Teils der Staubwolke.

Nun lassen wir in diesem Ruhesystem des Staubes zwei Testteilchen an eng benachbarten Stellen los und betrachten, wie ihre Bahnen aufgrund der Gravitation auseinanderdriften. Im Moment des Loslassens sollen die Teilchen in Ruhe sein, d.h. im Ruhesystem des Staubes gilt für die Vierergeschwindigkeiten u der beiden Teilchen   u = (c, 0)  . Wenn wir von schwachen Gravitationsfeldern ausgehen, haben wir damit den nichtrelativistischen Grenzfall: Gravitationsquelle (Staub) und Testteilchen ruhen am Anfang relativ zueinander. Der Ausdruck   ρ(u)   =   T(u,u) / c4   müsste also in die nichtrelativistische Massendichte   ρ   aus dem Newtonschen Gravitationsgesetz übergehen. Wegen   u = (c,0)   ist   ρ(c,0)   =   T((c,0), (c,0)) / c4   =   T00 / c2  , d.h. es muss   T00   =   ρ c2   sein.

Und das ist auch schon alles! Alle anderen Komponenten des Energie-Impuls-Tensors sind im Ruhesystem des Staubes Null! Letztlich wird der Begriff Staub genau durch diese Eigenschaft des Energie-Impuls-Tensors definiert. Wie wir gleich sehen werden, bedeutet dies, dass kein Druck sowie keine Kräfte zwischen den Staubteilchen vorliegen. Nun können wir auch leicht die Massen-Energie-Dichte ausrechnen, die auf Testteilchen wirkt, die sich mit Vierergeschwindigkeit   u   =   (γc, γv)   im lokalen Ruhesystem des Staubes bewegen:

  ρ(u)   =   T(u,u) / c4   =   T00 u0 u0 / c4   =   ρ u0 u0 / c2   =   ρ γ2

Wir sehen hier sehr schön, dass die Energiedichte ρ keine skalare Funktion ist: betrachtet man sie aus dem mit Vierergeschwindigkeit u bewegten Bezugssystem, so nimmt sie um den Faktor γ2 zu. Ein Faktor γ repräsentiert dabei die Zunahme der kinetischen Energie der Staubteilchen, die ja aus dem mit u bewegten Bezugssystem heraus ebenfalls bewegt erscheinen. Der andere Faktor γ repräsentiert die Lorentz-Kontraktion des Raumes: Der Raum erscheint in Bewegungsrichtung um den Faktor 1/γ verkürzt, und die Staubteilchen drängen sich entsprechend auf weniger Raum zusammen, was die Energiedichte erhöht. Zum Vergleich: eine ruhende elektrische Ladungsdichte ρel erscheint aus einem mit u bewegten Bezugssystem nur um den Faktor γ zuzunehmen. Dort wirkt sich nur die Lorentzkontraktion aus; die Ladungen selber werden (anders als die Energie eines Teilchens) bei zunehmender Geschwindigkeit nicht größer. Daher ist die elektrische Ladungsdichte auch die Zeitkomponente eines Vierervektors, die Massen-Energie-Dichte dagegen die Zeit-Zeit-Komponente eines Tensors mit 2 Indices.

Natürlich kann man den Energie-Impuls-Tensor in jedes andere Bezugssystem umrechnen, denn das Transformationsverhalten ist ja durch die Tensoreigenschaft festgelegt: T(u,v) darf nicht vom Bezugssystem abhängen. Wir wollen hier noch nicht genauer darauf eingehen (Details folgen später).

Eine Eigenschaft des Energie-Impuls-Tensors ist noch wichtig: es gilt in der speziellen Relativitätstheorie für jeden Energie-Impuls-Tensor allgemein die Gleichung

  ∑ν   d/dxν   Tμν   =   0  

Dabei wurden die Indices mit Hilfe der metrischen Matrix nach oben gezogen. Was diese Gleichung bedeutet, sehen wir weiter unten. Für den Energie-Impuls-Tensor von Staub können wir die Gleichung lokal im Ruhesystem des Staubes auswerten. Da nur   T00   =   T00   =   ρ c2   ungleich Null ist, ergibt sich:

  d/dx0   T00   =   c dρ/dt   =   0  

Im Ruhesystem der Staubkörnchen ändert sich also deren Massen-Energie-Dichte nicht. Das ist unmittelbar einleuchtend, denn wenn die Staubkörnchen sich nicht bewegen, so ändert sich auch ihre räumliche Massenverteilung nicht.


Der Energie-Impuls-Tensor einer reibungsfreien Flüssigkeit:

Betrachten wir einen Energie-Impuls-Tensor Tμν (Indices mit der metrischen Matrix hochgezogen), der in einem lokalen frei fallenden Inertialsystem die folgende Gestalt hat: Tμν ist eine Diagonalmatrix mit   T00   =   ρ c2   (wie bei Staub) und   Tkk   =   p   . Natürlich stellt sich die Frage: Welche Bedeutung hat p (der Buchstabe deutet es bereits an: p steht für den Druck)?

Dazu müssen wir uns einige generelle Gedanken über die Bedeutung der Komponenten Tμν in der speziellen Relativitätstheorie machen (also in karthesischen Minkowskikoordinaten). Siehe dazu z.B. Feynman Vorlesungen über Physik, Band II Elektromagnetismus und Struktur der Materie oder Landau, Lifschitz: Lehrbuch der theoretischen Physik, Band II: Klassische Feldtheorie, §32 Der Energie-Impuls-Tensor.

Wie oben bereits erwähnt, fordern wir für jeden Energie-Impuls-Tensor in der speziellen Relativitätstheorie in karthesischen Minkowskikoordinaten allgemein die Gleichung

  ∑ν   d/dxν   Tμν   =   0  

(warum, sehen wir später). Wir betrachten nun im vierdimensionalen Minkowskiraum alle Raum-Zeit-Punkte in einem bestimmten Zeitintervall und nennen die Menge dieser Raum-Zeit-Punkte   V   . Anschaulich kann man sich einen vierdimensionalen Würfel in der Raumzeit vorstellen, bei dem man die drei Intervalle der räumlichen Koordinaten immer größer werden lässt und das zeitliche Intervall festhält. V ist also eine Zeitscheibe der Raumzeit mit einer bestimmten Zeitdicke.


Nun ist die Größe   ∑ν   d/dxν   Tμν   ein Skalar, von der wir das Volumenintegral über die Zeitscheibe V bilden können:

  ∫V   ( ∑ν   d/dxν   Tμν )   dV   =   ∫V   (div T(μ) )   dV  

wobei T(μ) der Tangentialvektor mit Koordinaten Tμν ist und in koordinatenunabhängiger Schreibweise   (div T(μ) )   dV   =   d * ωT(μ)   ist mit der 1-Form   ωT(μ)   =   ∑ν   Tμν dxν   und dem Hodge-Sternoperator, der daraus eine 3-Form macht (siehe die Definition der Divergenz in Kapitel 5.1.12 Hodge-Sternoperator, Volumenform, Gradient, Divergenz, Rotation ). Wir führen im Folgenden die koordinatenunabhängige Schreibweise immer mit auf, auch wenn wir sie nicht unbedingt brauchen.

In Minkowskikoordinaten ist das Volumenelement dV einfach gegeben durch   dx0 dx1 dx2 dx3   (das ist in der allgemeinen Relativitätstheorie in krummlinigen Koordinaten nicht so!). Der Integrand ist für jedes μ also die folgende 4-Form (zu Differentialformen siehe Kapitel 5.1.11 Höhere Differentialformen und der Integralsatz von Stokes ):

  η(μ)   :=   ∑ν   d/dxν   Tμν   dx0 Λ dx1 Λ dx2 Λ dx3   =     (div T(μ) )   dV   =   d * ωT(μ)  

Diese 4-Form können wir andererseits als äußere Ableitung einer 3-Form schreiben:

  η(μ)   =:   dπ(μ)     mit     π(μ)   =   ∑ν   Tμν   dAν   =   * ωT(μ)  

Dabei ist beispielsweise   dA0   =   dx1 Λ dx2 Λ dx3

Nach dem Integralsatz von Stokes gilt nun

  ∫V   η(μ)   =     ∫V   dπ(μ)   =     ∫δV   π(μ)   =   ...

Das letzte Integral geht dabei über den Rand von V. Wir wollen nun annehmen, dass zu jeder Zeit im Räumlich-Unendlichen der Energie-Impuls-Tensor hinreichend schnell gegen Null geht (was bei einer räumlich lokalisierten Materie-Energie-Verteilung selbstverständlich ist), so dass die Randintegrale über die räumlich unendlich fernen Randräume mit zwei Orts- und einer Zeitkoordinate gleich Null sind. Es bleiben dann nur die beiden Randraum-Integrale mit drei Ortskoordinaten und fester Zeitkoordinate übrig:

  ...   =   ∫R3   π(μ) |x0 = ct'   −   ∫R3   π(μ) |x0 = ct

Nun ist aber   ∑ν   d/dxν   Tμν   =   0   , d.h.   η(μ)   =   0   und somit auch

  ∫V   η(μ)   =   ∫R3   π(μ) |x0 = ct'   −   ∫R3   π(μ) |x0 = ct   =   0

Die beiden Integrale zur Zeit t bzw. t' müssen also gleich groß sein, und da t und t' beliebig sind, bedeutet das, dass das Integral   ∫R3   π(μ)   nicht von der Zeit abhängt. Da dieses Integral über einen Raum mit konstanter Zeit geht, trägt nur der Term mit   dA0   zum Integral bei:

  ∫R3   π(μ)   =   ∫R3   Tμ0   dA0   =   ∫R3   Tμ0   dx1 dx2 dx3   =:   ∫R3   Tμ0   d3x   =:   c Pμ

mit dem räumlichen Volumenelement   d3x   =   dx1 dx2 dx3   in karthesischen Koordinaten. Den Faktor c haben wir eingefügt, damit Pμ die Dimension eines Impulses hat. Tatsächlich können wir Pμ mit dem Gesamt-Viererimpuls der betrachteten Massen-Energie-Verteilung ansehen, wenn wir T00 als Energiedichte der Verteilung interpretieren, denn dann ist

  c P0   =   ∫R3   T00   d3x

die Gesamtenergie der Verteilung, und da Pμ wegen des Tensorcharakters von Tμν ein Vierervektor ist, muss Pi mit i = 1, 2, 3 der zugehörige räumliche Gesamtimpuls des Systems sein -- nur so ist gesichert, dass z.B. eine ruhende Gesamtmasse nach einem Boost auch einen passenden Gesamt-Impuls besitzt. Halten wir fest:

  • Zusammenhang zwischen Gesamtimpuls-Vierervektor und Energie-Impulstensor:

    In der speziellen Relativitätstheorie gilt in den karthesischen Minkowski-Koordinaten eines jeden Inertialsystems: Einen Tensor Tμν, der die Gleichung

      ∑ν   d/dxν   Tμν   =   0  

    erfüllt und bei dem wir die Komponente T00 als Energiedichte der betrachteten Masse-Energieverteilung interpretieren, bezeichnen wir als Energie-Impuls-Tensor. Der Gesamt-Viererimpuls dieser Verteilung ist dann gegeben durch

      Pμ   :=   1/c   ∫R3   Tμ0   d3x

    Insbesondere ist P0 die Gesamtenergie der Verteilung. Dieser Gesamt-Viererimpuls ist wegen   ∑ν   d/dxν   Tμν   =   0   zeitlich konstant. Aufgrund der obigen Volumenintegration können wir den Vierervektor mit Komponenten   Tμ0 / c   als Vierer-Impulsdichte-Vektor der Verteilung interpretieren.

Aber wie kann man die anderen Komponenten von   Tμν   mit ν > 0 interpretieren?

Beginnen wir mit den räumlichen Komponenten   T0j   mit j = 1, 2, 3 und schreiben die Gleichung   ∑ν   d/dxν   Tμν   =   0   für μ = 0 explizit aus:

  1/c d/dt   T00   +   ∑j   d/dxj   Tμν   =   0  

Wir können nun über ein räumliches Volumen G integrieren und im zweiten Integral den Integralsatz von Stokes für dreidimensionale Räume (auch Integralsatz von Gauß genannt) anwenden:

  d/dt   ∫G   T00   d3x   =   − c   ∫δG   ∑j   T0j dAj

(die dAj gehören hier zum zweidimensionalen räumlichen Flächenelement, d.h. sie sind die Komponenten des Flächenelement-Normalenvektors). Links steht die zeitliche Veränderung der Energie im Gebiet G, und rechts steht demnach der Energiefluss durch die Oberfläche des Gebietes, denn die Gesamtenergie muss ja nach dem oben Gesagten erhalten bleiben. Daher können wir den räumlichen Vektor

  S   :=   c (T01, T02, T03)  

als Energiestrom pro Flächeneinheit interpretieren, ganz analog zur Flächenstromdichte j bei Ladungsströmen.

Nun fehlt nur noch die Interpretation der räumlichen Komponenten   Tij   mit i = 1, 2, 3 und j = 1, 2, 3. Auch hier können wir wie gerade zuvor die Gleichung

  d/dt   ∫G   Ti0 / c   d3x   =   − ∫δG   ∑j   Tij dAj

herleiten (wir haben noch durch c dividiert). Da   Tμ0 / c   oben der Vierer-Impulsdichte-Vektor war, sind   Ti0 / c   die räumlichen Komponenten des Impulsdichte-Vektors. Auf der linken Seite steht also die zeitliche Änderung der i-ten räumlichen Komponente des Gesamtimpulses im Gebiet G, und rechts steht demnach der Impulsfluss der i-ten Impulskomponente durch die Oberfläche von G, denn der Gesamtimpuls muss insgesamt erhalten bleiben. Daher können wir den räumlichen Vektor

  σ(i)   :=   (Ti1, Ti2, Ti3)  

als Impulsstrom der i-ten Impulskomponente pro Flächeneinheit interpretieren. Der Ausdruck   ∑j   Tij dAj   =   σ(i) dA   mit dem Skalarprodukt zwischen σ(i) und dem Flächenelement-Normalenvektor dA ist also der durch das Flächenelement strömende Impulsfluss der i-ten Impulskomponente.

Nun kann man in vielen Fällen diesen Impulsstrom auch ganz anschaulich als eine Kraftwirkung auf das Flächenelement interpretieren. Man kann sich z.B. ein geschlossenes Gefäß vorstellen, in dem sich ein Gas befindet. Das Innere ist dann das Raumgebiet G, und die dünne Gefäßwand ist der Rand δG des Raumgebietes. Schauen wir uns ein kleines Flächenelement auf der Gefäßwand mit Flächenelement-Normalenvektor dA an. Die Gasmoleküle prallen auf die Gefäßwand, wodurch sich ihr Impuls ändert, d.h. es entsteht ein Impulsfluss durch die Wand. Dem entspricht eine Kraft auf die Wand, die genau der mittleren zeitlichen Änderung der Impulse der Gasmoleküle entspricht. Die Kraft pro Fläche ist gleich dem Impulsstrom pro Fläche. Daher können wir   ∑j   Tij dAj   =   σ(i) dA   auch interpretieren als i-te Komponente der Kraft, die auf das Flächenelement dA wirkt.

Man bezeichnet den 3-mal-3-Tensor   σij = σ(i),j = Tij   auch als Spannungstensor. Mit ihm lassen sich die inneren Kräfte z.B. in Festkörpern oder Gasen beschreiben. Wenn σij diagonal ist mit identischen Diagonalelementen, so ist die Kraft immer parallel zum Flächenelement-Normalenvektor, also senkrecht zur Fläche. Das ist z.B. bei Gasen oder Flüssigkeiten der Fall, wenn man die Viskosität (Zähigkeit) vernachlässigt. Wenn wir in diesem Fall also   σij   =:   p δij   schreiben, so ist die Kraft F auf ein Flächenelement mit Flächenelement-Normalenvektor dA gegeben durch   F = p dA  . Das ist für p genau die Definition des Drucks! Genau so hatten wir den Energie-Impulstensor für eine reibungsfreie Flüssigkeit (oder ein reibungsfreies Gas) oben aufgebaut, und nun wissen wir auch, warum p darin die Interpretation eines Drucks haben muss!

Es ist interessant, sich einmal die Analogien zwischen elektrischer Ladung und Energie/Impuls klar zu machen -- dann versteht man auch, warum man für Energie und Impuls einen Tensor braucht, für die elektrische Ladung dagegen nur einen Vierervektor:

  • Wir gehen zunächst einfach davon aus, dass wir für die relativistische Beschreibung elektrischer Ladungs- und Stromverteilungen einen Vierervektor   j   =   (jμ)   =   (cρ j)   und für die relativistische Beschreibung von Energie- und Impulsverteilungen einen Tensor Tμν benötigen. Es gelten die Kontinuitätsgleichungen

      ∑ν   d/dxν   Tμν   =   0  
      ∑ν   d/dxν     jν   =   0  

    Für jeden festen Index μ verhält sich also Tμν genauso wie jν . Man hat es also statt mit nur einem Vierervektor im Energie-Impuls-Fall mit 4 solchen Vierervektoren zu tun.

  • Aufgrund der Kontinuitätsgleichung kann man (wie weiter oben gezeigt) herleiten, dass die folgenden Größen zeitlich konstant sind:

      c Pμ   :=   ∫R3   Tμ0   d3x
      c Q   :=   ∫R3     j0   d3x

    d.h. wir können j0 als die räumliche Dichte der Größe   c Q   und Tμ0 für jedes μ als die räumliche Dichte der Größe   c Pμ   interpretieren. Jetzt sehen wir auch, warum wir für Energie und Impuls den Index μ brauchen: nicht nur P0 ist erhalten, sondern auch Pk . Und: Die Energie P0 ist anders als die Ladung Q kein Skalar, sondern die nullte Komponente eines Vierervektors, verhält sich also anders bei Bezugssystemwechseln (die Integrale rechts kann man auch invariant schreiben, indem man über einen raumartigen dreidimensionalen Schnitt durch die Raumzeit integriert). Gesamtenergie und Gesamtimpuls eines Systems müssen in der Relativitätstheorie einen zeitunabhängigen Vierervektor bilden (sofern keine äußeren Kräfte wirken)! Dies erklärt den ersten Index von Tμν . Der zweite Index ist notwendig, wenn man zu den zeitunabhängigen Gesamt-Größen die entsprechenden zeitabhängigen räumlichen Dichten und Flächenstromdichten bilden möchte, so wie dies analog bei der elektrischen Stromdichte jν der Fall ist. Dies zeigt der folgende Punkt:

  • Man kann aus der Kontinuitätsgleichung (wie weiter oben gezeigt) die Gleichungen

      d/dt   ∫G   Tμ0   d3x   =   − c   ∫δG   ∑k   Tμk dAk
      d/dt   ∫G     j0   d3x   =   − c   ∫δG   ∑k     jk dAk

    ableiten (k läuft von 1 bis 3). So wie wir oben j0 als die räumliche Dichte der Größe   c Q   und Tμ0 als die räumliche Dichte der Größe   c Pμ   interpretieren, so können wir aufgrund dieser Gleichungen den räumlichen Vektor   j = (jk)   als Flächenstromdichte der Größe   Q   und den räumlichen Vektor   T(μ) := (Tμk)   für jedes μ als Flächenstromdichte der Größe   Pμ   interpretieren.

Kommen wir noch einmal zurück zum Gesamt-Viererimpuls   Pμ   :=   1/c   ∫R3   Tμ0   d3x   . Diese Größe ist für eine Materie-Energie-Verteilung in einem gegebenen Inertialsystem eindeutig und wegen   ∑ν   d/dxν   Tμν   =   0   auch zeitunabhängig. Es zeigt sich aber, dass verschiedene Energie-Impuls-Tensoren Tμν zum selben gesamt-Viererimpuls Pμ führen können. Betrachten wir konkret den Tensor

  T ' μν   :=   Tμν   +   ∑σ   d/dxσ   ψμνσ       mit     ψμνσ   =   − ψμσν

Wir rechnen leicht nach, dass auch   ∑ν   d/dxν   T ' μν   =   0   ist, denn wegen der Antisymmetrie von ψμσν in den beiden hinteren Indices und der Vertauschbarkeit der Ableitungen ist   ∑νσ   d/dxν   d/dxσ   ψμνσ   =   0   . Außerdem ist der Viererimpuls von Tμν und T ' μν derselbe, wenn wir fordern, dass ψμ0σ im räumlich Unendlichen so gegen Null geht, dass gilt (wegen der Antisymmetrie ist übrigens unten   ψμ00 = 0   ):

  ∫R3     ∑σ   d/dxσ   ψμ0σ   d3x   =   ∫δR3   ∑k = 13   ψμ0k   dAk   =   0

Woher kommt nun die Mehrdeutigkeit im Energie-Impuls-Tensor? Im Grunde reicht die Formel   Pμ   :=   1/c   ∫R3   Tμ0   d3x   nicht aus, um   Tμ0 d3x   als Vierer-Impulskomponenten des Volumenelementes zu interpretieren. Man weiß lediglich, dass die Terme über das gesamte Volumen aufintegriert den Gesamt-Viererimpuls ergeben. Wir können jedoch ein weiteres Objekt hinzunehmen; den vierdimensionalen Drehimpulstensor. Eine detaillierte Darstellung dazu findet man z.B. in Landau, Lifschitz: Lehrbuch der theoretischen Physik, Band II: Klassische Feldtheorie. Dort wird gezeigt, dass im vierdimensionalen Drehimpulstensor sich die Terme   Tμ0 d3x   nur dann als Vierer-Impulskomponenten des Volumenelementes interpretieren lassen, wenn der Energie-Impuls-Tensor Tμν symmetrisch ist! Schauen wir uns das etwas genauer an:

In der speziellen Relativitätstheorie ist die Zeitunabhängigkeit des Gesamt-Viererimpulses Pμ eine Folge davon, dass Verschiebungen der Raum- und Zeitkoordinate die Physik des Systems nicht ändern (Translationsinvarianz). Insgesamt muss aber die Physik in der speziellen Relativitätstheorie unter einer größeren Symmetriegruppe invariant sein: der Poincaregruppe. Neben Translationen der Raum-Zeit-Koordinaten gehören dazu die Lorentztransformationen, also die linearen Transformationen der Raum-Zeit-Koordinaten, so dass sich die Minkowskimetrik von Vierervektoren nicht ändert (siehe Kapitel 3.5 Die mathematische Struktur der Poincaregruppe ). Die Invarianz unter Lorentztransformationen führt zu einer weiteren zeitlich erhaltenen Größe: dem vierdimensionalen antisymmetrischen Drehimpulstensor. Bei einem System aus Massepunkten (Teilchen) lautet dieser Tensor:

  Mμν   :=   ∑n   ( xμn pνn   −   xνn pμn )

Dabei kennzeichnet der Index n das n-te Teilchen. Bei den räumlichen Komponenten erkennt man den dreidimensionalen Drehimpulsvektor L wieder:   L3 = M12   usw.. Wenn wir nun zu einer kontinuierlichen Massenverteilung übergehen, so würden wir gemäß der Formel   Pμ   :=   1/c   ∫R3   Tμ0   d3x   gerne den Term   1/c Tμ0 d3x   als μ-te Impulskomponente des Volumenelementes   d3x   interpretieren. Dann hätte   Mμν   die Form

  Mμν   =   1/c   ∫R3   ( xμ Tν0   −   xν Tμ0 )   d3x

Welche Bedingung muss der Integrand erfüllen, damit dieser Tensor zeitunabhängig ist? Vergleichen wir diesen Ausdruck mit dem zeitunabhängigen Viererimpuls

  Pμ   :=   1/c   ∫R3   Tμ0   d3x

Wenn wir darin   Tμ0   durch   ( xμ Tν0   −   xν Tμ0 )   ersetzen, so erhalten wir den Drehimpulstensor. Nun hatten wir oben gezeigt, dass die Kontinuitätsgleichung

  ∑σ   d/dxσ   Tμσ   =   0  

zur Zeitunabhängigkeit von   Pμ   führt. Analog fordern wir die Kontinuitätsgleichung

  ∑σ   d/dxσ   ( xμ Tνσ   −   xν Tμσ )   =   0  

und können vollkommen analog zum Viererimpuls die Zeitunabhängigkeit nachrechnen. Diese Gleichung können wir weiter vereinfachen, wobei wir   d/dxσ xμ   =   δμσ   sowie die Kontinuitätsgleichung   ∑σ   d/dxσ   Tμσ   =   0   verwenden:

  ∑σ   d/dxσ   ( xμ Tνσ   −   xν Tμσ )   =   Tνμ   −   Tμν   =   0  

d.h. der Energie-Impuls-Tensor muss symmetrisch sein. Halten wir fest:

Symmetrie des Energie-Impuls-Tensors:

Wenn wir für den Gesamtimpuls und den vierdimensionalen Drehimpulstensor gleichzeitig die Ausdrücke

  Pμ   :=   1/c   ∫R3   Tμ0   d3x
  Mμν   =   1/c   ∫R3   ( xμ Tν0   −   xν Tμ0 )   d3x

verwenden wollen, so dass der Term   1/c Tμ0 d3x   als μ-te Impulskomponente des Volumenelementes   d3x   interpretiert werden kann, und wenn Gesamtimpuls und Drehimpulstensor zeitlich konstant sein sollen, so muss der Energie-Impuls-Tensor   Tμν   symmetrisch sein.

Ein letztes Argument für die Symmetrie zumindest der räumlichen Komponenten von Tμν ergibt sich, wenn man das Drehmoment, das auf ein Volumen wirkt, einmal über die im Volumen wirkende Kraftdichte und einmal über die Kraft auf die Oberfläche ausdrückt. Nur wenn die räumlichen Komponenten von Tμν symmetrisch sind, stimmen die beiden Ausdrücke überein, so dass die Integranden auch die beabsichtigte Interpretation haben können.

Man kann sich überlegen, dass man ψμνσ immer so wählen kann, dass der Energie-Impuls-Tensor symmetrisch wird, so dass wir den Vierervektor mit Komponenten   Tμ0   wirklich als Vierer-Impulsdichte-Vektor der Verteilung interpretieren können. Auch die anderen Komponenten von Tμν haben dann erst die oben beschriebene Interpretation. Schauen wir uns an, wie man ein passendes ψμνσ findet: Zunächst einmal kann man Tμν aufteilen in einen symmetrischen und einen antisymmetrischen Anteil:

  Tμν   =   (Tμν + Tνμ) / 2   +   (Tμν − Tνμ) / 2

Wenn man nun den Term   ∑σ   d/dxσ   ψμνσ   mit   ψμνσ   =   − ψμσν   hinzuaddiert, so soll dieser den antisymmetrischen Anteil neutralisieren:

  ∑σ   d/dxσ   ψμνσ   =   − (Tμν − Tνμ) / 2

Eine Lösung dieser Gleichung ist   ψμνσ   =   ( xμ Tνσ   −   xν Tμσ ) / 2   , denn wir hatten oben beim Drehimpulstensor bereits die Gleichung   ∑σ   d/dxσ   ( xμ Tνσ   −   xν Tμσ )   =   Tνμ   −   Tμν   gezeigt.

Es ergibt sich eine sehr interessante Konsequenz, wenn wir die beiden räumlichen Vektoren mit Komponenten   Ti0   bzw.   T0i   miteinander vergleichen (siehe oben):

Aus der Symmetrie von Tμν folgt, dass ein Energiestrom immer mit einem Impuls verbunden ist! Der Energie-Stromflächendichte-Vektor ist gleich dem Impulsdichtevektor (mal c2).

Energie verhält sich also in diesem Sinne genau wie Masse (die hier auch als Energie gerechnet wird). Man kann sich anhand von Beispielen leicht von der Richtigkeit dieser Aussage überzeugen. Schauen wir uns beispielsweise in einem gegebenem Inertialsystem einen Fluss von Teilchen der Masse m an, die sich alle mit der Geschwindigkeit v bewegen. Die Anzahldichte im Bezugssystem (Teilchenzahl pro Volumeneinheit) bezeichnen wir mit n, und Energie und Impuls eines Teilchens bezeichnen wir mit E und p. Dann sind die Energie-Flächenstromdichte j (Energiedurchfluss pro Zeiteinheit und Flächeneinheit) und die Impulsraumdichte j' (Impuls pro Volumeneinheit) gegeben durch

  j   =   n E v  
  j'   =   n p  .

Für Teilchen mit Masse m ist   E   =   m c2 γ   und deshalb   p   =   m γ v   =   E v / c2  . Auch für masselose Teilchen gilt   p   =   E v / c2   mit |v| = c . Daher ist in beiden Fällen

  j   =   n E v   =   n p c2   =   j' c2

Einstein hat noch ein anderes schönes Argument für diesen Zusammenhang gegeben, das mit dem Schwerpunkt eines geschlossenen Wagens zu tun hat, in dem eine Energie von einer Wand zur anderen Wand strömt. Wer möchte, kann diesen Gedankengang beispielsweise nachlesen in Feynman Vorlesungen über Physik, Band II Elektromagnetismus und Struktur der Materie.

Für den Energie-Impuls-Tensor einer reibungsfreien Flüssigkeit bzw. eines reibungsfreien Gases hatten wir oben bereits den Ansatz gemacht, dass im lokalen Ruhesystem der Flüssigkeit Tμν eine Diagonalmatrix ist mit   T00   =   ρ c2   (wie bei Staub) und   Tkk   =   p   (die Indexstellung ist hier egal). Die obige Diskussion hat gezeigt, dass wir ρ als Massendichte bzw.   ρ c2   als Energiedichte der Flüssigkeit und p als den Druck interpretieren können, denn   Tij   =:   p δij   ist diagonal mit identischen Diagonalelementen, so dass die Kraft immer senkrecht zur Fläche wirkt (es gibt also keine Viskosität (Zähigkeit) ). Die Kraft F auf ein Flächenelement mit Flächenelement-Normalenvektor dA ist dann gegeben durch   F = p dA  , so wie das bei einem Druck der Fall sein muss.

Rechnen wir wieder die Massen-Energie-Dichte aus, die ein Testteilchen sieht, welches sich mit Vierergeschwindigkeit   u   =   (γc, γv)   im lokalen Ruhesystem der Flüssigkeit oder des Gases bewegen:

  ρ(u)   =   T(u,u) / c4   =   T00 u0 u0 / c4   +   ∑k   Tkk uk uk / c4   =  
  =   ρ γ2   +   p γ2 v2 / c4   =  
  =   ρ γ2   +   p (γ2 − 1) / c2

Das bewegte Testteilchen nimmt also nicht nur (wie bei Staub) eine um γ2 verstärkte Energie-Massendichte wahr, sondern auch der Druck trägt zur wahrgenommenen Energiedichte bei. Das kann man auch anschaulich verstehen: Zwar ruht die Flüssigkeit lokal in unserem Bezugssystem, d.h. die Komponenten Ti0 und damit die Gesamtimpulse Pi sind Null. Dennoch aber bewegen sich natürlich die Flüssigkeitsmoleküle statistisch und bauen so den Druck auf. Diese mikroskopischen Geschwindigkeiten verändern sich beim Bezugssystemwechsel und sorgen so für einen Energiedichte-Beitrag, der berücksichtigt werden muss.

Man kann über Lorentztransformationen nun den Energie-Impuls-Tensor in jedes andere Bezugssystem umrechnen, also z.B. den Energie-Impuls-Tensor einer sich gleichförmig bewegenden reibungsfreien Flüssigkeit ausrechnen. Die Form des Energie-Impuls-Tensors im Ruhesystem der Flüssigkeit bestimmt zusammen mit dem Transformationsgesetz eindeutig den Energie-Impuls-Tensor in einem anderen Inertialsystem, denn man kann diesen ja über das Transformationsgesetz eindeutig ausrechnen. Wenn wir daher eine allgemeine Formel für den Energie-Impuls-Tensor angeben, die im lokalen Ruhesystem den korrekten Ruhe-Energie-Impuls-Tensor ergibt und die sich relativistisch richtig transformiert, so ist diese Formel eindeutig. Für den Energie-Impuls-Tensor einer reibungsfreien Flüssigkeit lautet diese allgemeine Formel:

  • Allgemeine Form des Energie-Impuls-Tensors einer reibungsfreien Flüssigkeit in einem beliebigen lokalen Inertialsystem:

      Tμν   =   (ρ + p/c2) vμ vν   −   p gμν

    mit einem Vierer-Geschwindigkeitsvektor   v = (vμ)   . Für   v = (c, 0)   wird
      Tμν   =   (ρ + p/c2) c2 δμ0 δν0   −   p gμν  
    d.h.   T00   =   ρ c2   und   Tkk   =   p  . Wir können daher v als die lokale Vierergeschwindigkeit der reibungsfreien Flüssigkeit interpretieren.

Es gibt natürlich neben Staub und reibungsfreien Flüssigkeiten noch weitere Materieformen, die i.a. auch andere Energie-Impuls-Tensoren aufweisen. Ein Beispiel sind Festkörper oder auch viskose Flüssigkeiten, die auch interene Kräfte parallel zu Schnittflächen aufweisen können (sogenannte Scherkräfte). Zumeist sind diese Scherkräfte allerdings deutlich kleiner als Druck- oder Zugkräfte, so dass man sie vernachlässigt.

Ein anderes Beispiel ist das elektromagnetische Feld, das ebenfalls einen Energie-Impuls-Tensor besitzt. Die konkrete Formel findet man in jedem Buch über Elektrodynamik oder auch im Internet (siehe z.B. http://de.wikipedia.org/wiki/Energie-Impuls-Tensor ) -- ich möchte sie daher hier überspringen. Wichtig ist, dass hier die Spur des Tensors Null ist:
  Spurg T   =   ∑μν   gμν Tμν   =   0

Es ist interessant, dass innere Kräfte überhaupt einen Beitrag zur Energiedichte leisten, wenn man sie aus einem anderen Bezugssystem heraus betrachtet. Und dennoch müssen sie berücksichtigt werden, wenn man Energiedichten relativistisch korrekt beschreiben möchte. Ein schönes Beispiel dazu findet man in Feynman Vorlesungen über Physik, Band II Elektromagnetismus und Struktur der Materie, Kapitel 28 Elektromagnetische Masse. Dort wird eine kugelförmige statische negative Ladungsverteilung betrachtet, mit der man versuchsweise z.B. ein Elektron modellieren kann. Diese Ladungsverteilung erzeugt ein elektrisches Feld, das eine gewisse Energie aufweist. Beschleunigt man nun das Elektron und betrachtet Energie und Impuls, so stellt man fest, dass diese Größen sich nicht wie erwartet verhalten. Die Ursache dafür kennen wir nun: In einer kugelförmigen statischen negativen Ladungsverteilung stoßen sich die einzelnen Teile gegenseitig ab. Es muss daher Kräfte geben, die diese Abstoßung kompensieren und die Kugel zusammenhalten. Diese Kräfte muss man berücksichtigen, um das Verhalten für Energie und Impuls der Gesamtverteilung korrekt zu beschreiben.

In den meisten Fällen ist der Energie-Impuls-Tensor reibungsfreier Flüssigkeiten für die Beschreibung von gravitationserzeugender Materie vollkommen ausreichend. Verschiedene Materieformen unterscheiden sich dabei durch eine jeweils charakteristische Zustandsgleichung der Materie, die im lokalen Ruhesystem den Druck p und die Energiedichte ρ miteinander verknüpft:   p = f(ρ)   mit einer Materie- und Temperatur-abhängigen Funktion f. Hier sind einige charakteristische Zustandsgleichungen:

Zustandsgleichungen:

  • Die meisten reibungsfreien Flüssigkeiten (z.B. Gas):
      p = k ρ     mit einer Materie- und Temperatur-abhängigen Konstante k

  • Staub (nichtrelativistische kollisionsfreie Materie, niedrige Temperatur):
      p = 0     d.h.   k = 0 .

  • Strahlung (inkohärentes Photonengas oder hochrelativistisches Gas mit sehr hoher Temperatur):
      p   =   ρ c2 / 3     d.h.   k = c2/3 .
    Es folgt, dass die Spur wie beim Energie-Impuls-Tensor des elektromagnetischen Feldes gleich Null ist (so muss es für elektromagnetische Strahlung ja auch sein):   Spurg T   =   ∑μν   gμν Tμν   =   0


Der Energie-Impuls-Tensor in der gekrümmten Raumzeit:

Wir übertragen die obigen Energie-Impuls-Tensoren wie üblich in die gekrümmte Raumzeit, indem wir lokal in einem beliebigen Punkt p Riemannsche Normalkoordinaten einführen (also lokal ein frei fallendes Bezugssystem wählen) und dann fordern, dass bei ruhender Materie in diesem Punkt der Energie-Impuls-Tensor die obige Ruhesystem-Form annimmt. Da wir das an jedem Punkt so machen können, sind zunächst keine Probleme zu erwarten. Auch für beliebige Bezugssysteme können wir den Energie-Impuls-Tensor angeben, denn die Formel   Tμν   =   (ρ + p/c2) vμ vν   −   p gμν   ist tensoriell und macht daher auch in beliebigen Bezugssystemen Sinn. Interessanter wird es dann, wenn wir die Kontinuitätsgleichung   ∑ν   d/dxν   Tμν   =   0   und die damit zusammenhängende Interpretation des Energie-Impuls-Tensors in die gekrümmte Raumzeit übertragen wollen.

Als Verallgemeinerung der Kontinuitätsgleichung bietet sich die folgende tensorielle Gleichung an:

  ∑ν   Dν   Tμν   =   0  

mit den kovarianten Ableitungen   Dν   =   Dd/dxν   . Auf diese Weise ist gesichert, dass sich im Grenzfall verschwindender Gravitation in karthesischen Minkowskikoordinaten wieder die obige Kontinuitätsgleichung aus der speziellen Relativitätstheorie ergibt.

Man kann diese Kontinuitätsgleichung auch in die folgende Form bringen (siehe [MV] Kap. 4.6 ):

  1/|det(g)|   ∑ν   d/dxν   ( |det(g)|   Tμν )   =   − ∑νσ   Γμνσ Tνσ

mit der Determinante det(g) der metrischen Matrix (ich habe es nicht nachgerechnet -- daher keine Gewähr für Details wie Vorzeichen; die Struktur der Gleichung aber wird so ok sein). Die genaue Interpretation der Kontinuitätsgleichung im Sinne der Energie-Impuls-Erhaltung ist offenbar nicht ganz unproblematisch, wie diese komplizierte Gleichung vermuten lässt. Darin spiegelt sich wieder, dass Materie und Gravitationsfeld Energie und Impuls austauschen können. Allgemein ist es keineswegs trivial, für ein System mit Gravitation überhaupt Gesamt-Energie und -Impuls sauber zu definieren. Es gibt hierzu verschiedene Ansätze, die jeweils ihre Vor- und Nachteile haben.


Das verallgemeinerte Gravitationsgesetz (die Einsteinschen Feldgleichungen):

Wenn wir uns das bisher Erreichte ansehen, so könnte man davon ausgehen, dass wir soweit bereits fertig sind: Wir haben oben als Ansatz für das verallgemeinertes Gravitationsgesetz die Gleichung

  Rμν   =   4πGN Tμν / c4  

gefunden, wir kennen den Ricci-Tensor auf der linken Seite und wir wissen, wie der Energie-Impuls-Tensor auf der rechten Seite aussieht und wie er (zumindest lokal bzw. im Grenzwert verschwindender Gravitation) interpretiert werden kann. Tatsächlich war auch Albert Einstein zu einem bestimmten Zeitpunkt dieser Meinung, bis sich herausstellte, dass man ein Detail übersehen hatte: Die Kontinuitätsgleichung!

Kehren wir noch einmal zurück zu unserer Gezeitenkräfte-Argumentation, die zu   Rμν   =   4πGN Tμν / c4   geführt hatte: An einer Stelle hatten wir in Analogie zur nichtrelativistischen Gleichung   Spur(K)   =   div (grad Φ)   =   4πGN ρ   die relativistische Gleichung

  Ric(u,u)   =   4πGN ρ(u)  

aufgestellt, und für die Massen-Energiedichte   ρ(u)   , die die benachbarten Testteilchen sehen, den einfachen tensoriellen Ansatz

  ρ(u) c4   =   T(u,u)  

mit dem Energie-Impuls-Tensor T(u,u) gemacht. Das ist sicher zunächst die einfachste Möglichkeit. Im nichtrelativistischen Grenzfall ist die innere Teilchenbewegung der Materie klein und der Druck kann vernachlässigt werden, d.h. die Materie verhält sich wie Staub und wir haben   ρ(u)   =   ρ γ2   (siehe weiter oben). Für kleine Geschwindigkeiten der Testteilchen ist dann γ ungefähr gleich 1 und es ergibt sich wie gewünscht   ρ(u)   =   ρ  . Aber: der naheliegende Ansatz   ρ(u) c4   =   T(u,u)   ist nicht die einzige Möglichkeit, die den richtigen nichtrelativistischen Grenzwert ergibt. Hier ist ein anderer Kandidat:

  ρ(u) c4   =   ξ T(u,u)   +   (1 − ξ) T g(u,u)  

mit   T   :=   Spurg T   =   ∑μν   gμν Tμν   (analog zum Ricci-Skalar) und   g(u,u) = c2   . Für verschwindenden Druck und kleine Geschwindigkeiten ist sowohl   T(u,u)   =   ρ c4   als auch   T g(u,u)   =   ρ c4   , so dass sich für beliebiges reelles ξ der richtige Grenzwert   ρ(u)   =   ρ   ergibt.

Aber welchen Wert für ξ sollen wir nun wählen? Der nichtrelativistische Grenzwert kann diese Frage nicht beantworten. Aber: die Kontinuitätsgleichung für den Energie-Impuls-Tensor kann es!

Die Gleichung   Ric(u,u)   =   4πGN ρ(u)   bedeutet in Komponenten ausgeschrieben mit dem obigen Ansatz für ρ(u) :

  Rμν   =   4πGN/c4   ( ξ Tμν   +   (1 − ξ) T gμν )  

In Raumbereichen ohne Materie und Energie (also   Tμν = 0   und deshalb auch   T = 0   ) ist demnach weiterhin   Rμν = 0   , so wie wir das auch weiter oben geraten hatten. Bilden wir von dieser Gleichung mit Hilfe der Metrik die Spur (also   ∑μν   gμν ...   ), so ergibt sich wegen   ∑μν   gμν gμν   = ∑μ δμμ   =   4   die Gleichung

  R   =   4πGN/c4   ( ξ T   +   4 (1 − ξ) T)   =   4πGN/c4   (4 − 3ξ)   T  

Wir wollen hier nicht im Detail ξ ausrechnen, sondern einfach die Lösung angeben und diese dann rechtfertigen: der richtige Wert lautet   ξ = 2   . Und hier kommt die Begründung: Mit   ξ = 2   ergibt die obige Gleichung

  R   =   4πGN/c4   ( ξ T   +   4 (1 − ξ) T)   =   − 8πGN/c4   T  

und   Rμν   =   4πGN/c4   ( ξ Tμν   +   (1 − ξ) T gμν )   vereinfacht sich zu

  Rμν   =   8πGN/c4   ( Tμν   −   T/2 gμν )  

In diese Gleichung können wir   R   =   − 8πGN/c4   T   einsetzen und erhalten   Rμν   =   8πGN/c4   Tμν   +   R/2 gμν   oder umgestellt

  Rμν   −   R/2 gμν   =   8πGN/c4   Tμν  

Den Tensor auf der linken Seite bezeichnet man auch als Einstein-Tensor:

  Gμν   :=   Rμν   −   R/2 gμν  

d.h. unser Ansatz für das verallgemeinerte Gravitationsgesetz lautet nun

  Gμν   =   8πGN/c4   Tμν  

Die Begründung für   ξ = 2   (das haben wir ja bereits verwendet) ergibt sich nun, wenn wir die vierdimensionale Divergenz bilden. Es gilt nämlich bei verschwindender Torsion und einer Metrik, die mit der kovarianten Ableitung verträglich ist, die sogenannte kontrahierte Bianchi-Identität (siehe z.B. [MV2] Kap. 6,7 ; man kann diese Identität aus der zweiten Bianchi-Identität (siehe Kapitel 5.1.8 Krümmung ) durch geeignete Spurbildung mit Hilfe der Metrik nachrechnen -- wir überspringen dies hier):

  ∑ν   Dν   Gμν   =   0  

Aus dem verallgemeinerten Gravitationsgesetz folgt damit automatisch die Gleichung   ∑ν   Dν   Tμν   =   0  , wie es für den Energie-Impuls-Tensor sein muss. Dieses Ergebnis erhalten wir nur für   ξ = 2  !

Es zeigt sich, dass das obige Gravitationsgesetz keine weiteren versteckten Fallstricke enthält. Außerdem hat es seit seiner Formulierung durch Einstein im Jahr 1915 alle experimentellen Tests ohne Probleme überstanden und gilt daher als das allgemein akzeptierte Gesetz zur relativistischen Beschreibung der Gravitation. Fassen wir dies noch einmal zusammen:

Das relativistische Gravitationsgesetz (die Einsteinschen Feldgleichungen):

Der Energie-Impuls-Tensor Tμν von Materie und die Krümmung der vierdimensionalen Raumzeit sind über die sogenannten Einsteinschen Feldgleichungen miteinander verknüpft. Diese lauten:

  Gμν   =   8πGN/c4   Tμν  

Dabei verwenden wir:

  • Einstein-Tensor:   Gμν   :=   Rμν   −   R/2 gμν  
  • Ricci-Tensor:   Rνσ   :=   ∑μ   Rμνμσ  
  • Riemannscher Krümmungstensor:   Rμνμσ  
  • Ricci-Skalar:   R   :=   ∑νσ   gνσ Rνσ  

Eine dazu gleichwertige Form ist

  Rμν   =   8πGN/c4   ( Tμν   −   T/2 gμν )  

mit   T   :=   ∑νσ   gνσ Tνσ   , denn es gilt   R   =   − 8πGN/c4   T   . In Raumbereichen ohne Materie und Energie (also   Tμν = 0   ) ist demnach   Rμν = 0   .

Aufgrund der kontrahierten Bianchi-Identität   ∑ν   Dν   Gμν   =   0   erfüllt der Energie-Impuls-Tensor automatisch die Gleichung   ∑ν   Dν   Tμν   =   0   .


Herleitung der Einsteinschen Feldgleichungen aus einem Variationsprinzip:

Man kann die obigen Einsteinschen Feldgleichungen auch noch über einen anderen Weg erhalten: über ein Variationsprinzip! Das ist sehr beruhigend, denn unser obiger Weg war ja nur ein intelligentes Raten, und wenn man dasselbe Ergebnis auch auf einem ganz anderen Weg erreichen kann, so verstärkt das sicher unser Vertrauen. Allerdings muss man auch bei diesem alternativen Weg raten, aber nur einmal, und zwar ganz am Anfang: man muss eine naheliegende Formel für das Wirkungsfunktional des Gravitationsfeldes finden!

Die Ableitung des verallgemeinerten Gravitationsgesetzes aus einem Wirkungsprinzip erfolgte nicht durch Albert Einstein, sondern durch den Mathematiker David Hilbert, der zu Anfang des zwanzigsten Jahrhunderts sicher der berühmteste Mathematiker war (siehe auch Die Grenzen der Berechenbarkeit, Kapitel 1 ).


David Hilbert (1862 - 1943), Quelle: Wikipedia


Das Variationsprinzip (auch Wirkungsprinzip oder Prinzip der kleinsten Wirkung genannt) wird in Die Grenzen der Berechenbarkeit, Kapitel 5.4.3 Die Quantisierung der klassischen Mechanik und für Felder in Die Grenzen der Berechenbarkeit, Kapitel 5.4.4 Die kanonische Quantisierung des freien elektromagnetischen Feldes ausführlich behandelt. Ich möchte mich deshalb hier relativ kurz fassen:

Man startet mit einem Wirkungsfunktional, das den dynamischen Feldern (Variablen) der Theorie reelle Zahlen zuordnet. Genauer: Man setzt bestimmte Randbedingungen für die Felder in Raum und Zeit voraus (die Felder müssen zumeist im Unendlichen in Raum und Zeit hinreichend schnell verschwinden) und betrachtet anschließend irgendwelche beliebigen (stetig-differenzierbaren) Felder als Funktion von Raum und Zeit, die diese Randbedingungen erfüllen (sie müssen aber noch keinerlei Bewegungsgleichung erfüllen). Das Wirkungsfunktional ordnet nun jeder dieser denkbaren Feldfunktionen eine reelle Zahl zu -- die sogenannte Wirkung. Das Prinzip der kleinsten Wirkung besagt nun, dass die physikalischen Feldfunktionen genau diejenigen sind, bei denen das Wirkungsfunktional einen minimalen (genauer: einen stationären, d.h. in erster Ordnung konstanten) Wert für die Wirkung ergibt. Diese Felder erfüllen dann die Euler-Lagrange-Gleichungen -- das sind dann die Bewegungsgleichungen der Felder, auch Feldgleichungen genannt.

Wie kommt es, dass ein solches Variationsprinzip möglich ist? Die Quantentheorie gibt dafür eine Begründung an: In der Feynman'schen Pfadintegralformulierung trägt jede denkbare Feldkonfiguration (nennen wir die A ) mit einem Summanden (genauer: Integralbeitrag)   D(A)   exp [i S[A] / h/ ]   zur Gesamt-Wahrscheinlichkeitsamplitude eines Messergebnisses bei. Dabei ist D(A) ein geeigntetes Integrationsmaß (die Details dazu sind recht kompliziert) und S[A] ist die Wirkung der Feldkonfiguration A (d.h. A ist eine Funktion der Raumzeit, die Werte (Vektoren) im n-dimensionalen reellen Raum liefert; ein Beispiel für A sind die elektromagnetischen Potentiale). Wenn nun S[A] relativ groß im Vergleich zum Planchschen Wirkungsquantum h ist ( → klassischer Grenzfall), so löschen sich die meisten Amplituden der vielen denkbaren Feldkonfigurationen gegenseitig aus, außer bei den Feldern, die fast identische Wirkungen haben, d.h. bei denen S[A] sich kaum mit A ändert. Das ist beispielsweise bei einem Minimum der Fall. Die Felder in der Nähe des Minimums von S[A] haben damit die größte Wahrscheinlichkeit, und im klassischen Grenzfall ist es dann gerade das Minimum von S[A], das übrig bleibt. Details dazu siehe Die Grenzen der Berechenbarkeit, Kapitel 5.4.5 Pfadintegral-Quantisierung des freien elektromagnetischen Feldes

Man sieht also, dass aus Sicht der Quantentheorie die Wirkung das zentrale Element der Theorie ist. Alleine deswegen ist es wichtig, ein Wirkungsfunktional für die Gravitation zu kennen, das die Einsteinschen Feldgleichungen reproduziert. Hier ist es:

  • Wirkungsfunktional der Gravitation:

      S[g]   :=   c4/(8πGN) SH[g]   +   SM[g]     mit     SH[g]   :=   ∫   dV   R

    Dabei ist   dV   =   √|det g|   dx0 dx1 dx2 dx3   =:   √|det g|   d4x   das invariante Volumenelement (siehe Kapitel 5.1.12 Hodge-Sternoperator, Volumenform, Gradient, Divergenz, Rotation ), R ist der Ricci-Skalar und SM ist die Wirkung der gravitationserzeugenden Materie. Entsprechend ist SH die Wirkung des Gravitationsfeldes (auch Hilbert-Wirkung genannt -- daher das kleine H unten). Als dynamische Variable der Theorie dienen die Matrixelemente der metrischen Matrix.

Wer Die Grenzen der Berechenbarkeit, Kapitel 5.4.4 Die kanonische Quantisierung des freien elektromagnetischen Feldes kennt, dem ist vielleicht Folgendes aufgefallen: Wir hatten dort vorausgesetzt, dass der Integrand der Wirkung nur die dynamischen Felder und deren ersten Ableitungen nach Raum und Zeit enthalten darf. Damit ist garantiert, dass die Feldgleichungen nur maximal zweite Ableitungen der Felder nach Raum und Zeit enthalten. Nun enthält der Ricci-Skalar R aber auch zweite Ableitungen der metrischen Matrixelemente! Man kann aber zeigen, dass hier diese zweiten Ableitungen für das Variationsprinzip irrelevant sind, so dass dennoch in den Feldgleichungen nur maximal zweite Ableitungen der Metrik auftreten. Details dazu findet man beispielsweise in Landau, Lifschitz: Lehrbuch der theoretischen Physik, Band II: Klassische Feldtheorie, §93 Die Wirkungsfunktion für das Gravitationsfeld.

Die minimale Wirkung findet man nun wie üblich, indem man für die willkürlichen   gμν   in   S[g]   den Ansatz   gμν   +   ε ημν   macht. Darin ist   gμν   nun die metrische Matrix, für die die Wirkung minimal ist (man hätte auch   gμνmin   dafür schreiben können), und   ε ημν   ist die beliebige Abweichung (die Variation) davon. Das Minimum suchen wir über die Gleichung

  d/dε S[g + εη] |ε = 0   =   0   .

Aus Die Grenzen der Berechenbarkeit, Kapitel 5.4.4 wissen wir, dass dies gerade die Funktionalableitung von S ist. Physiker verwenden auch gerne die formale Schreibweise

  d/dε S[g + εη] |ε = 0   =:   ∫   d4x   ∑μν   δS/δgμν   ημν   =:   ∫   dV   1/√|det g|   ∑μν   δS/δgμν   ημν

Die konkrete (trickreiche) Rechnung möchte ich mir hier ersparen. Man findet sie z.B. in Landau, Lifschitz: Lehrbuch der theoretischen Physik, Band II: Klassische Feldtheorie, Kapitel XI Die Gleichungen des Gravitationsfeldes, oder auch in Sean M. Carroll: Lecture Notes on General Relativity, Kapitel 4 Gravitation, http://pancake.uchicago.edu/~carroll/notes/ sowie in G. 't Hooft: Introduction to General Relativity, Kapitel 8 The Action Principle http://www.phys.uu.nl/~thooft/lectures/genrel.pdf . Das Ergebnis lautet:

  d/dε SH[g + εη] |ε = 0   =   ∫   dV   ∑μν   Gμν   ημν

  →     1/√|det g|   δSH/δgμν   =   Gμν

Setzen wir jetzt noch

  d/dε SM[g + εη] |ε = 0   =:   ∫   dV   ∑μν   Tμν   ημν

  →     1/√|det g|   δSM/δgμν   =:   Tμν

so ergibt   d/dε S[g + εη] |ε = 0   =   0   mit   S[g]   =   c4/(8πGN) SH[g]   +   SM[g]   gerade die Einsteinschen Feldgleichungen

  Gμν   =   8πGN/c4   Tμν  

Übrigens ist die obige Gleichung   1/√|det g|   δSM/δgμν   =:   Tμν   in der allgemeinen Relativitätstheorie eine ganz allgemeine Vorschrift, um aus einem Wirkungsfunktional für Materie den zugehörigen Energie-Impuls-Tensor zu definieren, der automatisch symmetrisch ist. Dass sich so die bekannten Energie-Impuls-Tensoren ergeben, kann man nachweisen. Wichtig ist, dass der Energie-Impuls-Tensor nur positive Energien (Massen) repräsentieren darf, d.h. in einem lokalen Inertialsystem muss T00 positiv sein. Negative Energien erlauben alle möglichen exotischen Lösungen für die Einsteinschen Feldgleichungen, z.B. Wurmlöcher oder Warp-Blasen -- Star Treck Fans sind sicher begeistert, aber in der physikalischen Realität führen solche Lösungen zu großen Problemen, und außer in sehr extremen Situationen (Urknall, Quanten-Gravitation) sollten sie nicht vorkommen.


Diskussion des Einsteinschen Gravitationsgesetzes:

Die Einsteinschen Feldgleichungen

  Gμν   =   8πGN/c4   Tμν  

sind zunächst bei vorgegebenem Energie-Impuls-Tensor   Tμν   Gleichungen für 16 Matrixelemente   Gμν  , die wiederum Funktionen der metrischen Matrix und ihrer ersten Ableitungen sind (die wiederum Funktionen von Raum und Zeit sind). Da es sich um symmetrische Matrizen handelt, bleiben nur   4 + 3 + 2 + 1   =   10   unabhängige Gleichungen übrig. Da zusätzlich die 4 Gleichungen   ∑ν   Dν   Gμν   =   0   gelten, haben wir schließlich nur 6 unabhängige Differentialgleichungen für die 10 Komponenten der metrischen Matrix. Es bleiben also 4 Freiheitsgrade in der metrischen Matrix, die nicht durch die Einsteinschen Feldgleichungen festgelegt werden. Und das ist auch gut so, denn diese 4 Freiheitsgrade brauchen wir, um Koordinatenwechsel und damit Bezugssystemwechsel der 4 Raum-Zeit-Koordinaten zu ermöglichen. Es soll nämlich nicht die metrische Matrix selbst, sondern die Metrik g(u,v) in beliebigen Koordinaten bestimmbar sein. Analog ändert sich auch oben die Wirkung S[g] nicht, wenn man g nur in anderen Koordinaten ausdrückt. Das gesuchte Minimum von S[g] ist also eher ein Tal, das in Richtung der g's verläuft, die durch Koordinatenwechsel ineinander umwandelbar sind.

Tatsächlich kann man zeigen, dass die Einsteinschen Feldgleichungen ein wohldefiniertes Anfangswertproblem für die Metrik ergeben (siehe z.B. Sean M. Carroll: Lecture Notes on General Relativity http://pancake.uchicago.edu/~carroll/notes/ ). Dazu gibt man zunächst eine raumartige 3-dimensionale Hyperfläche in der Raumzeit vor. Raumartig bedeutet, dass man in jedem Punkt immer ein lokales Inertialsystem wählen kann, so dass die unmittelbaren Nachbarpunkte als gleichzeitig angesehen werden können (den Begriff der Gleichzeitigkeit hatten wir oben bereits näher betrachtet). Auf dieser Hyperfläche soll nun die Metrik und die Ableitung der Metrik in eine nicht-tangentiale Richtung zur Hyperfläche vorgegeben sein -- das sind die Anfangsbedingungen. Die Veränderung der Metrik in Richtung weg von der Hyperfläche entspricht in gewissen lokalen Bezugssystemen der zeitlichen Entwicklung. Diese zeitliche Entwicklung lässt sich nun mit Hilfe von 6 der 10 Einsteinschen Feldgleichungen bestimmen. Die übrigen 4 Gleichungen dagegen dienen als Nebenbedingungen, die das Bezugssystem auf der Hyperfläche einschränken -- das braucht man, um eine Zeitkoordinate identifizieren zu können, denn man kann nicht beliebige Kombinationen von metrischer Matrix und deren Ableitungen auf der Hyperfläche vorgeben. Der Formalismus weist große Ähnlichkeiten mit dem Lagrange-Formalismus bei Eichtheorien auf, bei dem auch nicht alle Lagrange-Gleichungen eine zeitliche Entwicklung von Funktionen beschreiben (siehe Das Unteilbare, Kapitel 5.4.4 Die kanonische Quantisierung des freien elektromagnetischen Feldes, man betrachte dort insbesondere die kanonisch konjugierte Impulskomponente π0 ). Die Freiheit, das Koordinatensystem und damit das Raum-Zeit-Bezugssystem zu wechseln, entspricht der Eichfreiheit bei Eichtheorien wie dem Elektromagnetismus.

Man kann hier noch sehr viel weiter ins Detail gehen, doch das würde den Rahmen dieses Kapitels sprengen. Statt dessen wollen wir noch auf zwei Veranschaulichungen der Einsteinschen Feldgleichungen eingehen, die ihren physikalischen Inhalt verdeutlichen.

Die erste Veranschaulichung stammt von Richard Feynman. Man findet sie in Feynmans Vorlesungen über Physik, Band II Elektromagnetismus und Struktur der Materie in Kapitel 42 Der gekrümmte Raum sowie in The Feynman Lectures on Gravitation (Westview Press, Boulder, Colorado, 2002). Feynman legt dabei den Schwerpunkt auf die Krümmung des Raumes (und nicht der Raumzeit):

  • Anschauliche Formulierung des Einsteinschen Gravitationsgesetzes nach Richard Feynman:

    Greifen wir in einem materieerfüllten Raumgebiet eine Kugel heraus, die genügend klein ist, so dass die Dichte ρ der gravitationserzeugenden Materie-Energie-Verteilung innerhalb praktisch konstant ist. Dann ist der sogenannte Exzessradius für die Kugel proportional zur in ihr enthaltenen Masse bzw. Energie (über den Druck sagt Feynman hier nichts). Der Exzessradius   re   ist dabei der Unterschied zwischen dem Radius   r   , den man aufgrund der gemessenen Kugeloberfläche   A   gemäß der euklidischen Formel   A   =   4 π r2   berechnet, und dem tatsächlich gemessenen Kugelradius   rg   , also

      re   =   r − rg  

    Damit beschreibt der Exzessradius die Abweichung der tatsächlichen räumlichen Geometrie von der gewohnten euklidischen Geometrie. Es gilt

      re   =   GN/(3 c2)   M

    mit der Masse   M   innerhalb der Kugel. Der Exzessradius der Erde beträgt beispielsweise 1,5 Millimeter, der der Sonne etwa einen halben Kilometer. Diese Formulierung ist gleichwertig zum Einsteinschen Gravitationsgesetz, wenn man sie für Kugeln beliebiger Geschwindigkeit (unterhalb von c) voraussetzt.

Eine zweite sehr schöne Veranschaulichung inclusive Herleitung, die den Focus auf die Krümmung der Raum-Zeit (nicht nur des Raumes) legt, findet man in John Baez, Emory Bunn: The Meaning of Einstein's Equation, http://math.ucr.edu/home/baez/einstein/einstein.pdf . Man startet mit einer sehr kleinen (infinitesimalen) kugelförmigen Anordnung von frei beweglichen winzigen Staubpartikeln. Die Staubpartikel sollen eine so geringe Masse haben, dass ihr Gravitationsfeld vernachlässigt werden kann. Das Volumen dieser Anordnung zum Zeitpunkt t wollen wir mit   V(t)   bezeichnen. Zum Startzeitpunkt   t = 0   sollen sich die Staubpartikel relativ zueinander nicht bewegen, d.h.   dV(t)/dt |t = 0   =   0  . Diese Aussage macht nur Sinn, weil wir von sehr kleinen Anfangs-Abständen zwischen den Staubpartikeln ausgehen, so dass sich die Geschwindigkeiten in eindeutiger Weise in erster Ordnung über infinitesimale Parallelverschiebungen miteinander vergleichen lassen. Bei größeren Abständen ist ein solcher Vergleich ja wegen der Wegabhängigkeit der Parallelverschiebung nicht möglich.


Nach einer kurzen (infinitesimalen) Zeitspanne wird sich die Position der Staubpartikel relativ zueinander verändern, sofern ein Gravitationsfeld vorhanden ist. Im Gravitationsfeld der Erde werden beispielsweise die weiter unten liegenden Staubpartikel etwas stärker angezogen als die weiter oben liegenden. Die Staubpartikel beschleunigen relativ zueinander. Dies ist genau die Gezeitenwirkung der Gravitation, die wir oben im Zusammenhang mit der equation of geodesic deviation bei der Motivation der Einsteinschen Feldgleichungen betrachtet hatten. Man kann sagen, dass letztlich in dieser equation of geodesic deviation der physikalische Kern des Einsteinschen Gravitationsgesetzes steckt. Es wundert daher nicht, dass wir mit dieser Gleichung als Ausgangspunkt wieder zu einer Beschreibung der Gravitation gelangen werden, die gleichwertig zum Einsteinschen Gravitationsgesetz ist.

Durch die Beschleunigung der Staubpartikel zum Startzeitpunkt verändert sich auch das Volumen der kugelförmigen Anordnung der Staubpartikel. Die Volumenänderung zum Startzeitpunkt ist zwar Null, da die Staubpartikel zu diesem Zeitpunkt sich relativ zueinander nicht bewegen, aber die zeitliche Änderung dieser Volumenänderung (also die zweite zeitliche Ableitung des zeitabhängigen Volumens) ist nicht Null, denn die Staubpartikel beschleunigen relativ zueinander. Mit Hilfe der equation of geodesic deviation kann man herleiten:

  • Anschauliche Formulierung des Einsteinschen Gravitationsgesetzes nach John Baez und Emory Bunn:

    Für eine infinitesimale kugelförmige Anordnung (eine Wolke) winziger Testpartikel, die sich im kugelförmigen Volumen V(t) in einem äußeren Gravitationsfeld befinden und die sich zum Startzeitpunkt   t = 0   relativ zueinander in Ruhe befinden (d.h.   dV(t)/dt |t = 0   =   0   ), gilt:

      d2V(t)/dt2 |t = 0   =   − 4πGN/c4   V(0)   ∑μ Tμμ

    Da wir T00 als Energie-Massen-Dichte und Tkk als k-Komponente der Flächenstromdichte der k-ten Impulskomponente (also als Druck in k-Richtung) interpretieren können, besagt diese Gleichung in Worten:

    • Die Rate, mit der die Volumen-Änderungsgeschwindigkeit der winzigen Test-Kugelwolke anwächst, ist proportional zum Volumen der Wolke mal der Summe aus Energiedichte plus Druck in x-Richtung plus Druck in y-Richtung plus Druck in z-Richtung der gravitationserzeugenden Materie-Energie-Verteilung im Mittelpunkt der Kugel.

    Die Test-Kugelwolke selbst soll so leicht sein, dass sie praktisch kein Gravitationsfeld erzeugt. Die gravitationserzeugende Materie-Energie-Verteilung im Kugelvolumen soll ausschließlich über die Gravitation auf die Wolke der Testpartikel einwirken, also keine direkten Zusammenstöße oder Ähnliches.

    Diese Formulierung ist gleichwertig zum Einsteinschen Gravitationsgesetz, wenn man sämtliche kleinen Kugelwolken mit allen möglichen Anfangsgeschwindigkeiten in Betracht zieht, also alle in allen möglichen lokalen Inertialsystemen ruhenden Kugelwolken.

Das negative Vorzeichen zeigt, dass eine positive Energie-Massendichte und ein positiver Druck ein Schrumpfen der Kugelwolke bewirken -- Gravitation ist eine anziehende Kraft. Beim Druck kommt uns das merkwürdig vor, aber es geht hier um die rein gravitative Wirkung des Drucks. Die Testpartikel der Kugelwolke sollen nicht direkt durch den Druck der gravitationserzeugenden Materie beeinflusst werden, sondern nur durch deren Gravitationskraft! Normalerweise spielt der Druck für die Gravitation keine Rolle. In extremen Situationen oder auch bei Strahlung ist das anders. In einem Neutronenstern ist beispielsweise der Druck aufgrund des Pauliprinzips enorm groß -- nur so kann er den endgültigen Kollaps des Sterns verhindern. Der Druck erzeugt hier einen wesentlichen Anteil der Gesamtgravitation des Sterns!

Im leeren (aber nicht gravitationsfreien) Raum, z.B. außerhalb eines Sterns, ist die rechte Seite der Gleichung gleich Null. Somit ist auch   d2V(t)/dt2 |t = 0   =   0   , d.h. das Volumen der kleinen Test-Kugelwolke ändert sich nicht (denn   dV(t)/dt |t = 0   war ja ebenfalls Null). Die Wolke kann aber immer noch aufgrund lokal unterschiedlich starker Gravitationskräfte verzerrt werden, z.B. in einer Richtung gedehnt und in den beiden anderen Richtungen gestaucht werden, so dass ein volumengleicher Ellipsoid entsteht -- man spricht von Gezeitenkräften (engl.: tidal forces).

Die obige Überlegung ermöglicht es auch, im Krümmungstensor den Anteil des Ricci-Tensors und den des Weyl-Tensors (siehe oben) anschaulich zu unterscheiden: Im Einsteinschen Gravitationsgesetz steht der Ricci-Tensor, der für die Volumenänderung unserer kleinen Testwolke verantwortlich ist. Diese Volumenänderung wird durch Energiedichte und Druck am Ort der Wolke bewirkt -- genau das sagt das Einsteinschen Gravitationsgesetz. Der Weyl-Tensor dagegen besagt, wie sich die Testwolke bei konstantem Volumen im Gravitationsfeld aufgrund der Gezeitenkräfte verformt. In materiefreien Raumbereichen ist der Ricci-Tensor Null, nicht aber der Weyl-Tensor!



Die kosmologische Konstante:

Zum Abschluss wollen wir noch einen Zusatz diskutieren, den man in den Einsteinschen Feldgleichungen anbringen kann: die kosmologische Konstante Λ . Mit kosmologischer Konstante lauten die Einsteinschen Feldgleichungen:

  Gμν   =   8πGN/c4   Tμν   +   Λ gμν

Man kann sich vorstellen, dass zum Energie-Impuls-Tensor   Tμν   ein Term   c4/(8πGN) Λ gμν   hinzukommt. Diesen Term kann man als Energie-Impuls-Tensor des Vakuums interpretieren. Demnach besitzt das Vakuum eine Energiedichte   c4/(8πGN) Λ   und einen negativen Druck   − c4/(8πGN) Λ   (das negative Vorzeichen stammt von den räumlichen Diagonalelementen der metrischen Matrix). Die Formel   c4/(8πGN) Λ gμν   für den Energie-Impuls-Tensor des Vakuums garantiert, dass unter den lokalen Inertialsystemen keines als ruhend ausgezeichnet ist, denn in allen gleichförmig gegeneinander bewegten lokalen Ruhe-Inertialsystemen hat der Vakuum-Energie-Impuls-Tensor dieselbe Form (ein Boost verändert ja die Minkowski-Metrik nicht).

Setzen wir den Vakuum-Energie-Impuls-Tensor in unsere obige anschauliche Formulierung des Gravitationsgesetzes mit Hilfe der kleinen Test-Kugelwolke ein, so erhalten wir für das Volumen dieser Wolke

  d2V(t)/dt2 |t = 0   =   − 4πGN/c4   V(0)   ∑μ Tμμ   =   − 4πGN/c4   V(0)   (− 2)   c4/(8πGN) Λ   =   Λ V(0)

Das Kugelvolumen wächst also bei positiver kosmologischer Konstante, d.h. der Vakuum-Energie-Impuls-Tensor wirkt abstoßend! Das liegt daran, dass der negative Druck des Vakuums zwar denselben Betrag wie die positive Vakuum-Energiedichte hat, aber wegen der drei Raumdimensionen auch dreimal gezählt wird und so die positive Energiedichte mehr als kompensiert. Jede kleine Kugel aus Testteilchen dehnt sich aus. Man kann dies so interpretieren, dass sich der Raum insgesamt ausdehnt; ein expandierendes Universum ist die Folge, sofern die Wirkung der kosmologischen Konstante gegenüber dem Energie-Impuls-Tensor der Materie dominiert. Ob dies in unserem Universum der Fall ist, ist Gegenstand der Forschung. Seit 1998 hat man jedoch aufgrund der Messung von Helligkeit und Rotverschiebung weit entfernter Sternexplosionen (sogenannte Supernovae vom Typ Ia) deutliche Hinweise darauf, dass sich unser Universum tatsächlich beschleunigt ausdehnt. Es ist also durchaus möglich, dass die kosmologische Konstante in unserer Welt positiv ist und der leere Raum tatsächlich eine entsprechende Energiedichte und negativen Druck besitzt. Ursache könnten sogenannte Vakuum-Quantenfluktuationen sein (siehe z.B. Das Unteilbare, Kapitel 6.2 Richard Feynmans Graphen ). Wir dürfen gespannt sein, was die nächsten Jahre hierzu noch an interessanten neuen Entdeckungen bringen werden!


Literatur zu dem Thema:


zurück zum Inhaltsverzeichnis

last modified on 09 December 2009